Первое "свидание" с Gemini
Gemini – это мультимодальная нейросеть от Google.
“Мультимодальная” означает, что она может понимать и работать с разной информацией: текстом, кодом, изображениями, аудио и даже видео.
В основе Gemini лежат языковые модели. Такие модели используются, например, в телефонах, когда текстовая программа подсказывает вам правильное написание или следующее (по её мнению :)) слово. Мнение не взято с потолка, а сформировано на анализе многих текстов.
Продвинутая языковая модель не просто предлагает слово на основе нескольких букв, а анализирует большой объем информации.
И использует сложные математические вероятности, чтобы угадать наиболее подходящее следующее слово в последовательности. Это не случайный выбор.
Модель опирается на закономерности, которые она выучила в процессе обучения на огромном количестве текстовых данных.
Развитие технологий машинного обучения привело к появлению нейронных сетей – сложных систем уравнений, которые позволяют модели обрабатывать и понимать эти последовательности слов.
То, как мы взаимодействуем с этими моделями, имеет большое значение. Разработка эффективных запросов, напрямую влияет на качество генерируемого текста. Чем точнее и продуманнее ваш запрос, тем лучше будет результат.
Пример.
Вы получили неприятное письмо от классной руководительницы вашего сына по поводу его систематических опозданий в школу.
Разумеется, вы не первая мать, столкнувшаяся с такими проблемами и в “памяти” Gemini тысячи таких писем и ответов на них.
Если просто описать ситуацию и попросить ИИ написать ответ, вы получите общее, нейтральное письмо. Но вероятность того, что этот ответ совпадет с тем настроением, которое вы хотите передать учительнице – мала.
Возможно, вы полностью признаете вину и бьете челом. А может, вы считаете, что она необъективна и придирается именно к вашему сыну? И хотите мягко намекнуть на это, не вызвав конфликта?
В главе о письмах мы попрактикуемся на этом примере.
Кроме того, в обучение современных моделей,таких как Gemini, активно включается обратная связь от людей. Это помогает модели лучше соответствовать ожиданиям и генерировать полезные ответы.
Например, заметив вашу манеру общения с классной руководительницей вашего сына, нейросеть будет выбирать письма в таком же стиле.
И, наконец, одним из факторов, способствовавших широкому распространению искусственного интеллекта, стал его удобный и интуитивно понятный интерфейс, который сделал эту технологию доступной для миллионов пользователей по всему миру.
Искусственный интеллект (ИИ) может помочь в обычной жизни множеством способов, делая ее более удобной, эффективной и даже увлекательной. Вот несколько примеров:
1. Домашние дела и управление:
●
Умный дом: ИИ позволяет автоматизировать освещение, отопление, кондиционирование, системы безопасности. Вы можете управлять ими голосом или через приложения, а ИИ может оптимизировать энергопотребление, основываясь на вашем расписании и предпочтениях.
●
Планирование и организация: ИИ-помощники могут управлять вашими календарями, напоминать о встречах, составлять списки покупок, даже предлагать рецепты, исходя из имеющихся у вас ингредиентов.
●
Роботы-пылесосы и другая техника: ИИ позволяет этим устройствам эффективно ориентироваться в пространстве, избегать препятствий и выполнять свои задачи.
2. Образование и саморазвитие:
●
Персонализированное обучение: ИИ может адаптировать учебные материалы и темп обучения под индивидуальные потребности, предлагать дополнительные упражнения или объяснения.
●
Изучение языков: Приложения на основе ИИ могут помочь в отработке произношения, грамматики и расширении словарного запаса.
●
Доступ к информации: Быстрый поиск и обработка огромных объемов информации, что позволяет получить ответы на любые вопросы.
3. Здоровье и благополучие:
●
Фитнес-трекеры и приложения: ИИ анализирует данные о вашей активности, сне и питании, предлагая персонализированные рекомендации для улучшения здоровья.
●
Мониторинг здоровья: Некоторые устройства с ИИ могут отслеживать жизненно важные показатели и предупреждать о возможных проблемах.
●
Психическое здоровье: Приложения на основе ИИ могут предлагать упражнения для релаксации, медитации или даже базовую психологическую поддержку.
4. Развлечения и досуг:
●
Стриминговые сервисы: ИИ рекомендует фильмы, сериалы и музыку на основе ваших предпочтений и истории просмотров/прослушиваний.
●
Голосовые помощники: Могут проигрывать музыку, читать аудиокниги, отвечать на вопросы, рассказывать шутки и многое другое.
●
Игры: ИИ используется для создания более реалистичных противников и интерактивных миров.
5. Коммуникация и работа:
●
Переводчики: Мгновенный перевод текста и речи, облегчающий общение с людьми из разных стран.
●
Умные клавиатуры: Прогнозирование слов и фраз, автокоррекция, что ускоряет набор текста.
●
Виртуальные помощники на работе: Помогают в организации встреч, составлении отчетов, поиске информации.
6. Транспорт:
●
Навигаторы: ИИ анализирует дорожную ситуацию в реальном времени, предлагая оптимальные маршруты и объезды пробок.
●
Беспилотные автомобили (в перспективе): ИИ является основой для их работы, обеспечивая безопасность и эффективность передвижения.
7. Финансовое планирование:
●
Приложения для бюджета: ИИ может анализировать ваши траты, помогать составлять бюджет и давать советы по экономии.
●
Инвестиции: Некоторые платформы используют ИИ для анализа рынка и помощи в принятии инвестиционных решений.
В целом, ИИ становится все более интегрированным в повседневную жизнь, делая ее более комфортной, эффективной и персонализированной.
Как установить приложение Gemini.
Есть одно необязательное, но очень полезное условие – прежде чем работать с этой нейросетью, лучше зарегистрировать свой Google аккаунт. А если он уже есть – работать через него.
Санкции, конечно, затрудняют прямой доступ к Gemini, но много способов – VPN, много сайтов и чат-ботов в Телеграм , предоставляющих ограниченный или полный доступ. На некоторых моделях телефонов можно работать и в России работать без ухищрений. Ситуация быстро меняется – поэтому наберите в строке поиска и получите целый букет возможностей.
Итак, Gemini существует как в виде сайта ( ), так и в виде приложения на телефоне. Но интерфейс близок. Если вы разберётесь в приложении, то на компьютере проблем не возникнет.
Открываем приложение.
Сверху вы видите надпись "Gemini". Если на неё нажать, в бесплатном режиме доступны пять языковых моделей ( май 2025 года):
Flash 2.0 – подходит для повседневных задач.
Экспериментальная версия Flash 2.5 – здесь используются улучшенные алгоритмы, и перед выдачей программа анализирует и проверяет свой ответ.
Flash 2.5 Pro экспериментальная —для решения сложных, комплексных задач.
Deep Research помогает создавать глубоко проработанные отчёты и исследования.
Внизу приглашение в платную версию – Gemini Advanced, которая стоит 20 долларов в месяц. К ней прилагается Гугл Workspace и 2 Терабайта памяти. Но, конечно, без платной подписки можно легко обойтись, к тому же почти каждый месяц появляются новые функции. Есть возможность попробовать продвинутую версию – первый месяц бесплатно.
Давай теперь посмотрим на сам интерфейс Gemini. Он девственно чистый – почти пустой экран, лишь пара значков в углах и строка типа поиска. И оттого интуитивно понятный. Графического интерфейса пользователя (GUI), как у программ или веб-сайтов, с многочисленными кнопками, меню и окнами у него нет.
Главный элемент – это текстовый (или голосовой) диалог. Чтобы ввести запрос нажмите на плюс к в левой части текстового ввода или микрофончик в правой. Там же режим “Live” – три вертикальные чёрточки со звёздочкой. В этом режиме Gemini разговаривает с вами приятным практически живым голосом (как выбрать голос рассказано в главе “Настройка под себя”) и на экране появляются красивые визуальные эффекты.
Когда вы спрашиваете (текстом или голосом), Gemini обрабатывает запрос и отвечает голосом и текстом, стараясь быть полезной и информативной.
Gemini поддерживает контекст беседы, чтобы понимать последующие вопросы в рамках одного диалога, может использовать форматирование (например, списки, выделение жирным шрифтом) или блоки кода для лучшей читаемости.
“За кулисами” ИИ использует различные инструменты (например, поиск в интернете, выполнение кода), чтобы получить актуальную информацию или выполнить задачу, но вы напрямую с этими инструментами не взаимодействуете, а беседуете с Gemini естественным языком, как с человеком.
Но парочка кнопочек всё-таки имеются.
Если вы хотите начать новый диалог, нажмите кнопку с большим плюсом справа снизу. Иногда для вопроса нужно добавить файл – тогда нажимаем на значок плюса, и здесь мы можем загружать изображения, файлы, а также документы с Google Диска.
Слева вверху – аватар вашего аккаунта в Гугл или три черточки– у нас основное меню.
Сначала, конечно, приглашение попробовать продвинутую, платную версию Advanced.
Первый важный пункт меню – история действий в приложениях Gemini.
Предупреждение, что история чатов даже при отключенном сохранении может хранится до 72 часов.
Предлагается настроить режим автоматического удаления данных.
Сохраненная информация. Если вы нажмёте на него, увидите информацию, которую Gemini сохранил по вашему запросу. Здесь вы можете сохранить такую информацию, как: "Я придерживаюсь вегетарианской диеты, не предлагай мне рецепты с мясом",
Можно забыть то, что вы туда записали и получить нерелевантный ответ.
Если вы измените предпочтения в еде и забудете о сохранённой информации добиться рецептов с мясом будет сложнее.
Я сохранила только “Когда я спрашиваю про погоду – давай информацию о погоде в месте моего текущего месторасположения”. (Google, если вы разрешите, передаст ваши координаты из Google Maps).
Приложения. Огромным плюсом Gemini является теснейшее взаимодействие с сервисами Гугла – Google Mail, Maps, Drive, YouTube, Календарь, Отели, Авиабилеты, Документы, Задачи, Поиск, Таблицы и т.д.. Причем Гугл сам выбирает приложение, которые можно использовать в данном запросе.
Примеры:
“Найди письма мистера Х. и мои ответы на них. Представь диалог в виде текстового файла.”
“Найди заказы на Озоне за последний год и представь их в виде таблицы с датами и ценами.”
Но, к сожалению, именно в этом случае я сталкивалась с ошибками Gemini – пропускает письма. Надо проверять простым поиском. Технология новая, ошибки неизбежны.
Менеджер Gem-ботов. Это ваши ассистенты, которых вы можете заранее настроить и использовать для работы. Готовые Gem-боты от Google: Генератор идей, Карьерный консультант, Партнёр для программистов, Внешкольный наставник, Литературный редактор.
При желании вы сами можете своего “ассистента” создать.
О том, как его сделать и им пользоваться есть отдельная глава.
Значение пунктов “Новости”, “Центр конфиденциальности” и “Переключиться на Google Ассистента” понятно из названий.
Следующий пункт меню – Настройки. За ним скрывается много возможностей:
настроить языки – основной и дополнительные;
можно выбрать тёмную или светлую тему экрана;
здесь отображаются все ссылки, которыми вы делились.
Разрешить (или запретить) Gemini:
использовать информацию на экране;
прерывать рассказ, если вы заговорили, перебив её;
выбрать голос Gemini;
использовать информацию о контактах с ваших устройств;
использовать Gemini, даже если экран устройства заблокирован;
возможность переключиться на Гугл Ассистента – если вы привыкли к нему и хотите использовать его в некоторых случаях.
Отзывы и Справка так же прячутся за значком в правом верхнем углу.
Слева вверху расположен значок диалога. При нажатии раскрывается список чатов и расширения gem-боты:
Первое – это ваши чаты. Очень удобно, – если нужно вернуться к какому-то вопросу или продолжить предыдущую беседу. Gemini “помнит” содержание даже спустя несколько месяцев и всегда готов продолжить “беседу”.
Выделив продолжительным нажатием, ее можно закрепить, удалить или переименовать в появившемся после выделения меню.
Вы можете легко переключаться между чатами и находить нужную информацию.
Ниже – gem-боты. Как с ними работать мы рассмотрим в специальной главе.
Итак, мы рассмотрели интерфейс Google Gemini, историю чатов, настройки и мощные функции приложений. Как видите, Gemini – это не просто нейросеть для общения, а гибкий инструмент, который можно настроить под себя и интегрировать с привычными сервисами Google. Обязательно попробуйте!
Основы Gemini: Тестовые вопросы
Вопрос 1: Что означает термин "мультимодальная" применительно к нейросети Gemini?
* A. Может работать только с текстом.
* B. Может понимать и работать с разной информацией: текстом, кодом, изображениями, аудио и даже видео.
* C. Используется только для генерации кода.
* D. Требует специальных навыков для обработки изображений.
Вопрос 2: На чем основывается способность языковой модели Gemini предлагать наиболее подходящее следующее слово в последовательности?
* A. На случайном выборе слов.
* B. На анализе большого объема информации и сложных математических вероятностях.
* C. На подсказках от пользователя.
* D. На ручном вводе данных программистами.
Вопрос 3: Какое значение имеет разработка эффективных запросов (промптов) для взаимодействия с моделями ИИ, такими как Gemini?
* A. Никак не влияет.
* B. Напрямую влияет на качество генерируемого текста.
* C. Влияет только на скорость ответа.
* D. Увеличивает количество доступных моделей.
Вопрос 4: Чем может помочь ИИ в домашних делах?
* A. Только умный дом.
* B. Умный дом, планирование и организация, роботы-пылесосы и многое другое.
* C. Только составление списков покупок.
* D. Только оптимизация энергопотребления.
Вопрос 5: Каким образом ИИ может помочь в образовании и саморазвитии?
* A. Всего лишь помогает в отработке произношения.
* B. Адаптирует учебные материалы, помогает в изучении языков, обеспечивает доступ к информации и многое другое.
* C. Только создает новые учебные программы.
* D. Только переводит текст на другие языки.
Вопрос 6: Как ИИ может способствовать здоровью и благополучию?
* A. Мониторинг жизненно важных показателей и предупреждение о проблемах.
* B. Предложение упражнений для релаксации и базовой психологической поддержки.
* C. Анализ данных об активности, сне и питании для персонализированных рекомендаций.
* D. Все перечисленное.
Вопрос 7: Каковы некоторые способы получения доступа к Gemini в условиях затрудненного прямого доступа?
* A. Только через VPN.
* B. Через VPN, чат-боты в Телеграм и на некоторых моделях телефонов без ухищрений.
* C. Требует специальных разрешений от Google.
* D. Возможен только через платную подписку.
Вопрос 8: Какая из бесплатных языковых моделей Gemini (по состоянию на июнь 2025 года) подходит для повседневных задач?
* A. Gemini Advanced.
* B. Flash 2.0.
* C. Deep Research.