Gemini в России: как пользоваться Nano Banana 2 и генерации Veo 3 без головной боли

2026-04-30 12:54:22 Время чтения 31 мин 986

Получить доступ к Gemini 3 Pro в России
Получить доступ к Nano Banana 2 в России
Получить доступ к нейросети для генерации видео Veo 3

Решила разобраться по-серьёзному. Не "открыть один раз и показать друзьям", а сделать так, чтобы Gemini AI стал рабочим инструментом, который не отваливается через неделю. Перепробовала десятки сторонних обёрток, спалила прилично денег на подписках, часть сервисов оказалась мусором за дорого, часть - неожиданно крутой находкой.

Делюсь по-честному. Что работает в 2026 году, как пользоваться Gemini в России без танцев с бубном, где платить и где можно бесплатно потыкаться. Разберу Nano Banana 2 для картинок, дам десять рабочих промтов в фешн-стиле и расскажу про Veo 3.

Почему вокруг Gemini такой ажиотаж

Если коротко - Google наконец догнал и местами обогнал OpenAI. Gemini 3 Pro по бенчмаркам уделывает GPT по куче задач, особенно где нужна работа с большим контекстом, кодом и мультимодальностью. Но реально хайп взлетел не из-за текста, а из-за двух штук: Nano Banana 2 для картинок и Veo 3 для видео.

Nano Banana 2 (формально Gemini 3 Flash Image) - это та модель, которая умеет одновременно генерировать и редактировать изображения, держит лица консистентно и понимает сложные промты с тканями, светом, эмоциями. По качеству реально сопоставима с топовыми платными генераторами, а в чём-то и обгоняет.

Генерация видео в Veo 3 - отдельная история. Первая массовая модель, которая генерирует видео со встроенным звуком: шум ветра, голоса, диалоги, фоновая музыка. До этого все нейросети делали немое кино, и звуковую дорожку приходилось клеить отдельно. Теперь можно описать сцену "девушка идёт по парку, шуршат листья, кто-то вдалеке смеётся" и получить готовый клип со всем этим аудио. Звучит как магия, и это реально магия.

Текстовый чат Gemini тоже подтянулся. Длинный контекст до миллиона токенов, отличное понимание русского языка, умение работать с документами, картинками и кодом одновременно. Я загружаю PDF на 200 страниц и спокойно задаю вопросы по содержимому - то, на чём ChatGPT иногда глохнет.

Топ-5 площадок для работы с Gemini, Nano Banana 2 и Veo 3 в России

Study AI - моя основная рабочая площадка. Тарифы адекватные, есть и Gemini 3 Pro, и Nano Banana 2, и Veo 3.

Syntx AI - беру как запасной вариант, когда нужно прогнать большой объём генераций. Стабильный, без неожиданностей.

Gptunnel - агрегатор, через который удобно тестировать сразу несколько моделей в одном окне. Если только присматриваетесь к Gemini AI и не хотите заводить отдельную подписку - стартовать удобно отсюда.

Gogpt - Из плюсов - быстрый интерфейс и нормальная работа с длинными промтами для Veo 3.

MashaGPT - неочевидный, но рабочий вариант. Бот формата "просто открыл и пиши", без лишних настроек. Подходит, когда нужно быстро что-то нагенерить с телефона, не разбираясь в API.

Лично я гоняю Study AI и Gptunnel параллельно - один как основной, второй как страховка. Если у одного сервиса временные проблемы или лимиты исчерпаны, переключаюсь на второй за минуту.

Генерация в Nano Banana 2: что это такое простыми словами

Nano Banana 2 - обновлённая модель Google для работы с картинками. "Банановое" имя приклеилось ещё к первой версии и теперь уже официальное прозвище. Главная фишка - модель умеет одновременно генерировать новое и редактировать существующее, при этом держит лицо, если загрузить референс.

На пальцах: кидаете своё фото, пишете "пересади меня в цветущий яблоневый сад в льняном платье", и модель не лепит чужое лицо, а действительно сохраняет ваши черты. Год назад это было больной точкой почти всех нейросетей. У многих популярных генераторов и сейчас лицо превращается в собирательный образ, у Nano Banana 2 - сохраняется на 90-95%.

Второй важный момент - разрешение. Спокойно выдаёт 2K и 4K. Свои весенние кадры в прошлом году я печатала в фотокнигу, никто из друзей не догадался, что это нейросеть.

Третье - модель понимает сложные описания тканей и текстур. Попросишь "льняное платье цвета слоновой кости, чуть помятое от ветра", и оно действительно нарисует помятое, а не отглаженное по линейке. Эта детализация вытаскивает картинку из категории "ИИ-арт" в категорию "похоже на настоящую съёмку".

Четвёртое - умеет работать с несколькими изображениями сразу. Можно загрузить своё лицо, фотку понравившегося платья и кадр с локацией, и попросить собрать всё в один образ. Раньше для такого нужны были отдельные плагины и танцы с маской в Фотошопе.

10 промтов в фешн-стиле для Nano Banana 2

Все промты ниже рассчитаны на работу с вашим референсным фото. Загружаете 2-4 своих портрета (анфас, полупрофиль, разный свет), потом подставляете промт. Локации - современная Россия, май-весна, без клюквы и матрёшек.

Структура у меня всегда одна: локация, одежда с тканью и деталями, свет, поза, настроение, технические параметры камеры. Выкинь любой блок, и картинка теряет процентов 30 реализма.

Промт 1. Цветущий сад в Коломенском

Use the uploaded reference photo to preserve the woman's facial features. She wears a flowing ivory linen dress with delicate eyelet embroidery, standing in a blooming apple orchard in Kolomenskoye Park, Moscow. Wooden tower of the historical estate softly blurred in the background. Soft pink and white petals falling around her, she gently touches a low branch. Warm golden hour light, natural makeup, loose wavy hair with a single braid. Shot on Canon EOS R5, 85mm f/1.4, shallow depth of field, contemporary Russian fashion editorial style.

Мой главный фаворит на майские. Тёплый, чуть киношный кадр, который заходит и в соцсети, и в визитку для дейтинга. Локация считывается как "что-то русское, дачное", без перебора.

Промт 2. Тюльпановое поле в парке Горького

Editorial portrait based on the uploaded reference photo. The same woman wears a pastel sage green midi dress with puffy sleeves and a thin leather belt, walking through a vast tulip field in Gorky Park, Moscow. Modern park architecture and the Moskva river softly visible in the background. Wicker basket in her hand, straw hat tilted back. Soft diffused afternoon light, slight wind movement in the fabric. Film grain, Kodak Portra 400 colour palette, contemporary Moscow spring vibe.

Лаванда у нас не растёт, а тюльпановые поля в парке Горького и Зарядье - визуальный аналог Прованса. Плёночная стилизация Portra 400 закидывайте в любые "природные" промты, реально вытягивает картинку.

Промт 3. Завтрак на Патриарших

Use the uploaded reference photo to keep the same face. A stylish young woman in a black-and-white Breton striped top, high-waisted cream trousers and ballet flats, sitting at a small café table near Patriarshiye Ponds in Moscow. Holding a fresh croissant and a flat white. Old Moscow architecture in the background, blooming lilac branches above her, a vintage city bicycle leaning against the wall. Soft morning light, candid editorial mood, Sofia Coppola film aesthetic. Shot on 35mm lens, slight motion blur in the passersby.

Делала такой кадр для подруги-копирайтерши на аватарку, её московские клиенты решили, что она реально каждое утро завтракает на Патриках. А она вообще-то живёт в Бутово.

Промт 4. Сирень во дворе старой Москвы

Generate a portrait based on the uploaded reference photo, preserving the woman's facial features. She wears a white cotton midi dress with broderie anglaise lace details and a thin pastel blue ribbon belt. Standing in a quiet Moscow courtyard with old brick buildings, surrounded by fully bloomed lilac bushes in shades of purple and white. Holding a small bouquet of fresh lilacs. Late afternoon golden light, slight breeze in her loose hair, dreamy nostalgic atmosphere. Cinematic medium shot, soft focus background, Russian spring editorial mood.

Промт 5. Питер, Летний сад, минимализм

Editorial street style portrait using the uploaded reference photo. The same woman in an oversized beige trench coat, white t-shirt, straight-leg jeans and white leather sneakers, holding a large bouquet of fresh red tulips wrapped in craft paper. Walking through Saint Petersburg's Letniy Sad alley, classical sculptures and blooming trees softly visible in the background. Slight overcast sky for soft natural light. Minimalist editorial style, modern Russian fashion vibe, shot on Sony A7IV with 50mm prime lens.

Этот промт у меня стащили минимум три знакомые блогерши. Идеален для тех, кто не любит сладкие образы и предпочитает северный минимализм.

Промт 6. Дача и пикник под яблоней

Generate an image based on the uploaded reference photo, keeping the woman's facial features intact. She wears a soft blush pink slip dress with thin straps, sitting on a vintage checkered blanket on the grass at a Russian countryside dacha. Wicker picnic basket, fresh strawberries in an enamel mug, an open book and a glass of homemade kvass beside her. Wooden dacha house with carved window frames in the background, blooming apple tree above. Warm afternoon light, pink petals on the blanket, slow living mood, shot on medium format film camera.

Дача - универсальная российская локация, которая в нейросети читается мгновенно. Резные наличники - маленькая деталь, но именно она делает кадр своим, а не "куда-то в Европу".

Промт 7. Зарядье и панорамный мост

Fashion portrait based on the uploaded reference photo. The same woman in a vintage oversized denim jacket, white ribbed tank top, straight-leg light blue jeans and white canvas sneakers. Standing on the floating bridge in Zaryadye Park, Moscow, with the Kremlin towers softly blurred in the background. Hands in pockets, confident relaxed pose, sunglasses on her head, hair in a messy low ponytail. Bright spring midday light with soft shadows, modern Moscow street style, shot on Fujifilm X-T5.

Промт 8. Винтажный трамвай в Питере

Cinematic shot generated from the uploaded reference photo, preserving the woman's appearance. She wears a polka dot midi dress with a fitted bodice and full skirt, red lipstick, soft curled hair with a silk headscarf in vintage style. Standing next to a retro red Saint Petersburg tram on a cobblestone street, classical Petersburg facades around. Blooming chestnut trees above. Late afternoon golden light, slight haze, 1960s inspired Russian editorial style, warm tones.

Промт 9. Сакура в Ботаническом саду

Elegant portrait based on the uploaded reference photo. The same woman in a soft beige modern wrap dress with minimalist silhouette, walking along a path in the Moscow Botanical Garden during full sakura bloom. Light pink cherry blossoms everywhere, wooden bench with a takeaway coffee cup beside her, serene expression, low loose bun with a single hairpin. Soft overcast spring light, ethereal mood, Wim Wenders cinematic style, shot on Leica Q2.

В Москве реально цветёт сакура - в Главном Ботаническом саду РАН и в Аптекарском огороде. Очередь огромная, в нейросети - никаких очередей.

Промт 10. Стрит-стайл на Никольской

Bold street style portrait generated from the uploaded reference photo, keeping the woman's facial features. She wears a cropped leather jacket, white crop top, low-rise cargo pants and chunky white sneakers. Standing on Nikolskaya Street in Moscow, blooming chestnut trees and warm string lights softly visible above. Confident posture, hand on hip, slight smirk, messy bun, gold layered necklaces, small designer bag. Direct spring sunlight, contemporary Russian fashion magazine quality, shot on Canon 5D with 35mm lens.

Меняйте локации на свои - Казанский кремль, Эрмитаж, набережная в Нижнем, парк "Краснодар". Главное - подставлять конкретное место, а не абстрактное "русский город". Нейросеть Google лучше работает с точными ориентирами.

Veo 3: видео со звуком за две минуты

Перейдём к самой громкой части - генерация Veo 3. Это та модель, которая в прошлом году взорвала ИИ-сообщество, потому что впервые выдавала видео сразу со звуковой дорожкой.

Что умеет на практике. Создаёт ролик 5-8 секунд по текстовому описанию, с разрешением до 1080p, со встроенным звуком. Вы можете прописать в промте не только что происходит в кадре, но и какие звуки должны быть, какие реплики говорят персонажи, какая фоновая музыка играет. И всё это генерируется за один проход.

Простой пример моего рабочего промта: "A young Russian woman in a beige trench coat walks slowly through a blooming park alley in Moscow. She smiles softly, wind moves her hair. Birds chirping in the background, distant city sounds, soft footsteps on gravel. Cinematic golden hour light, shot on 35mm film, shallow depth of field, contemporary editorial style." На выходе - ролик, который реально можно вставить в рилс или клип, и никто не задумается, что это ИИ.

Качество движения у Veo 3 ощутимо выше, чем у конкурентов. Раньше любая нейросетевая видеогенерация страдала от "плавающих" кадров - руки телепортируются, лица меняются по ходу ролика, фон начинает плыть. Veo 3 эту проблему решил процентов на 80. Не идеально, но смотрибельно.

Звук - отдельный кайф. Можно прописать диалог, и модель сама синхронизирует губы персонажа с речью. Качество липсинка пока не уровня "Голливуд", но для коротких роликов выглядит убедительно.

Доступ к Veo 3 в России проще всего получить через те же агрегаторы из топ-5. Нативный доступ через гугловский Vertex AI требует корпоративного аккаунта с зарубежной картой - геморроя больше, чем пользы. Через Study AI или Gptunnel запустил, оплатил рублями, сгенерировал.

Лайфхаки, до которых я доходила своими шишками

Первый и главный - всегда указывайте камеру и объектив в промтах для картинок. Не понты, а реальная механика. Когда пишу "Canon R5, 85mm f/1.4", модель понимает, что нужна неглубокая резкость, мягкое размытие фона, портретная композиция. Без этой строчки получается общий план с резким фоном, который выглядит дёшево.

Второй - "снимайте" в плёночной стилизации, даже если хотите цифру. Слова Kodak Portra 400, Fujifilm Superia, film grain, slight haze добавляют картинке тёплоты и убирают пластиковую гладкость, по которой все вычисляют ИИ. Кожа становится живой, тени мягкими.

Третий - не бойтесь добавлять "недостатки". Помятая ткань, выбившаяся прядь, лёгкий румянец, чуть растрепавшийся пучок. Идеально вылизанный образ всегда читается как нейросеть. Подруга-стилист как-то сразу заметила, что плечо платья сидит слишком ровно. Я добавила "one strap slightly slipped off the shoulder" - стало в десять раз живее.

Четвёртый - для Veo 3 пишите промт как сценарий. Сначала визуал, потом действие, потом звук, потом стиль. Если впихнуть всё в одно предложение - получите кашу. Если разбить на блоки - модель чётко поймёт, что от неё хотят.

Пятый - используйте имена режиссёров и журналов как стилистический ярлык. Sofia Coppola aesthetic, Wes Anderson symmetry, Kinfolk magazine mood. Модель обучена на огромном пласте визуального материала и знает, как выглядит "софия копполовский" кадр - туманный, меланхоличный, в пастели.

Шестой, и это спасло мне нервы - всегда генерируйте 4-6 картинок за раз. Из шести вариантов один-два почти всегда отличные, два-три средненькие, и пара бракованных. Если генерите по одной - можно попасть на брак и решить, что промт плохой.

Седьмой - сохраняйте удачные промты в отдельный документ. Я завела заметку, где они сгруппированы по сезонам, локациям, стилистикам. Если бы не делала, потратила бы в три раза больше времени на тесты.

Личный опыт: что работает, а что нет

Главный провал - первый раз я попыталась сделать "снимаюсь у Спасской башни Кремля". Получилось ужасно. Башня кривая, перспектива поплыла, я больше похожа на туристку из 2009 года. Урок: знаковые места и достопримечательности крупным планом - не лучший выбор. Модель часто их искажает, потому что в датасете тысячи разных ракурсов одного объекта.

Что работает идеально - абстрактные природные локации с лёгким маркером места. Двор с сиренью в старой Москве, аллея в парке, набережная без узнаваемых зданий, дача с резными наличниками. Туда нейросеть не пихает узнаваемую географию, и картинка получается чистой.

Ещё одно болезненное открытие - не пытайтесь сразу генерировать сложный концепт. "Девушка в красном платье на велосипеде с букетом сирени на фоне Кремля в стиле советского кино под дождём" - получите кашу. ИИ путается в количестве деталей. Берите два-три ключевых элемента и докручивайте остальное в редактуре.

С Veo 3 другая история. Видеомодель любит динамику, но не любит сложные многослойные сцены. Если в кадре одновременно три человека, диалог, движущаяся камера и эффекты - модель сломается. Один герой, одно действие, понятный фон - получите кино. Два героя и сложная сцена - получите кашу.

Из неочевидного - женские образы у Nano Banana 2 получаются заметно лучше мужских. Не знаю, перекос ли это в обучающих данных, но факт. Для женской фотосессии в нейросети модель подходит почти идеально, для мужской придётся повозиться с детализацией бороды и черт лица.

Не злоупотребляйте "красотой". Если в каждом промте писать beautiful woman, perfect skin, gorgeous - модель скатится в Барби-эстетику с нереалистичными чертами. Лучше прописывать характер: thoughtful expression, confident gaze, warm subtle smile, soft melancholic mood. Это даёт глубину.

Ещё момент про Gemini-чат как языковую модель. По работе с русским языком он сейчас ощутимо лучше, чем многие конкуренты. Не пытается переводить с английского, понимает идиомы, разговорную речь, региональные особенности. Я через него редактирую тексты, и правок после него почти не делаю - в отличие от ChatGPT, после которого приходится вычищать "канцелярит".

Плюсы и минусы, без сладких иллюзий

Что реально круто. Скорость - полноценный весенний лукбук из 30 кадров за вечер. С фотографом это два дня съёмки плюс неделя на ретушь. Деньги - пополнение баланса в агрегаторе стоит как чашка кофе в день, против 15-30 тысяч за съёмку. Гибкость - не нравится платье, перегенерируйте. Не нравится локация, двадцать секунд и вы в Питере. Хочется в фиолетовых тонах, минута работы.

Veo 3 экономит ещё больше. Снять короткий ролик с актрисой, оператором, светом и звуком - это тысячи долларов и неделя планирования. Через нейросеть Google это десять минут и сто рублей. Качество не киношное, но для контента более чем достаточно.

Длинный контекст у Gemini Pro - отдельный плюс. Загружаю PDF с финансовым отчётом на 300 страниц, и спокойно задаю вопросы по содержимому. Раньше для такого нужны были отдельные сервисы для работы с документами, теперь всё в одной модели.

Теперь честно про минусы. Лица в Nano Banana 2 - в 5-10% случаев сидят неидеально. Иногда сходство 95%, иногда 70%. Если хотите кадр с предельно похожим лицом, придётся отбраковывать и перегенерировать. Я обычно из десяти вариантов отбираю два-три рабочих.

Руки. Боль всех нейросетей. Стало лучше, но всё ещё могут вылезти странные пальцы или шесть ногтей. Особенно если поза рук сложная. Совет: упрощайте позы или прячьте одну руку в карман.

Текст. Если в кадре должна быть надпись на сумке, чашке, журнале - забудьте. Будет белиберда. Либо убирайте текст из промта, либо потом дорисовывайте в Фотошопе.

Лимиты. Бесплатные планы на агрегаторах позволяют потыкаться, но для серьёзной работы баланс кончается быстро. Платная подписка или пополнение - неизбежная статья расходов, если вы не на пять минут зашли.

Veo 3 - дорогая модель. Одна генерация ролика стоит ощутимо дороже одной картинки. Если не очень считать, можно уйти в минус за вечер.

Где это можно использовать

Соцсети. Контент для постов, сторис, обложек, превью. Если ведёте блог про моду, лайфстайл, бизнес - ИИ-фотки спасают в моменты "снимать нечего, а постить надо". Veo 3 пригодится для коротких видеоформатов, где нужна красивая картинка с минимальным сценарием.

Маркетплейсы и Авито. Знакомая продаёт винтажные платья и показывает, как вещь смотрится на разных фигурах в разных локациях. Клиенты лучше представляют, как это будет на них.

Презентации, визитки, личный бренд. Эксперты, коучи, психологи, эйчары - всем нужны хорошие портреты. Корпоративный фотограф стоит дорого, образ нужно менять каждый сезон. Нейросеть закрывает задачу за вечер.

Маркетинг и реклама. Знакомая открывала бренд весенней одежды, нужны были маркетинговые кадры до старта продаж, когда самой одежды ещё нет, есть только эскизы и ткани. Мы сгенерировали полноценный лукбук на сайт и в рекламу через Nano Banana 2, потом досняли реальные фотки уже после первых продаж. Это позволило стартовать с красивой картинкой, не вваливая полмиллиона в съёмку до проверки спроса.

Видеоконтент. Veo 3 идеально подходит для коротких рекламных роликов, заставок, переходов, клипов с настроением. Один мой кейс - сделала пятисекундную заставку для канала на YouTube, где капли дождя стучат по окну, а на подоконнике стоит чашка кофе с паром. По старинке такое снимать - надо ждать дождя, готовить реквизит, ловить свет. Через Veo 3 - три минуты работы, включая написание промта.

Работа с документами. Текстовый Gemini AI - незаменим для работы с большими массивами текста. Анализирую договоры, разбираю ТЗ от клиентов, готовлю саммари по длинным статьям. Контекстное окно в миллион токенов - это реально много, влезает целая книга.

Ошибки и подводные камни

Главная ошибка новичков - думать, что хороший промт это длинный промт. Я вначале писала простыни на 500 слов, и результат был хуже, чем у короткого структурного описания. Оптимум - 60-100 слов, чётко по блокам.

Вторая - генерировать без референса лица. Если хотите получить именно своё фото, а не "девушку, похожую на вас", грузите 2-4 портрета в Nano Banana 2. Без этого получится среднестатистическая красотка без сходства.

Третья - копировать чужие промты вслепую. Те же самые промты на разных лицах работают по-разному. Девушке с квадратным лицом не подойдёт тот же ракурс, что и овальному. Адаптируйте.

Четвёртая, самая больная - публиковать без проверки. Я как-то выложила пост, не заметив шесть ногтей на пальце. Подписчики написали через минуту. Стыдно. С тех пор всегда увеличиваю кадр и проверяю руки, уши, шею, украшения.

Шестая - не сохранять историю чатов. Удачный диалог с языковой моделью - это иногда часы работы. Если случайно закрыл вкладку, восстановить не получится. Делайте экспорт важных переписок.

Седьмая - попытка перегнать профессионального фотографа на важных событиях. Не получится. На свадьбе, выпускном, в путешествии мечты - идите к фотографу, не экономьте. ИИ это инструмент для контента и обновления визуала, а не замена настоящих воспоминаний.

Восьмая - игнорировать обновления моделей. За полгода Gemini обновлялся раза четыре. То, что плохо работало в феврале, идеально работает в апреле. Перепроверяйте свои старые промты на новых версиях, иногда результаты приятно удивляют.

Вывод

Я уже не вижу смысла спорить, нейросети это хорошо или плохо. Это просто новый инструмент, как когда-то были мыльницы, потом цифровики, потом телефоны с режимом портрета. Каждый раз была паника "теперь всё умрёт", и каждый раз нет, не умирало. Просто появилась ещё одна опция для тех, кому нужна красивая картинка или видео без бюджета и времени на студию.

Десять промтов выше можно брать, докручивать под себя и за вечер собрать персональный весенний лукбук, который не стыдно показать. Veo 3 - для коротких видео, где раньше нужна была команда из пяти человек. А текстовый Gemini Pro в качестве рабочей лошадки для длинных документов - просто кайф.

В этом году на 1 мая у меня запланирована серия "Утро на даче" - пастельные тона, льняные платья, эмалированная кружка с чаем, цветущая яблоня, резные наличники. Сяду вечером с ноутбуком, заварю чай и за пару часов соберу весь весенний контент на месяц вперёд.

Время, которое раньше уходило на съёмку и ретушь, теперь трачу на нормальную прогулку с собакой по тому самому цветущему саду. Без камеры, без позирования, без стресса "получится или нет". Парадокс - чем больше у меня "ненастоящих" фоток, тем больше настоящей жизни.

Попробуйте. Хуже точно не будет.