В апреле 2025 года компания OpenAI представила значительное обновление своего искусственного интеллекта ChatGPT. Главной звездой стала модель o3, которая уже успела произвести настоящий фурор. По словам Сэма Альтмана, CEO OpenAI, именно эта модель вывела ChatGPT на новый уровень интеллектуального интерфейса. Она может не только генерировать текст, но и решать сложные задачи по программированию, анализировать изображения, строить графики и искать в интернете актуальную информацию.
Чем же отличается o3 среди других языковых моделей? Прежде всего своей универсальностью. Она сочетает функционал нескольких моделей одновременно, поддерживая как классический текстовый режим, так и инструменты для более глубокого анализа. Например, пользователь может отправить изображение, а модель самостоятельно его проанализирует, приблизит нужные фрагменты, применит код для выявления различий и предоставит понятный визуальный результат.
Более того, o3 поддерживает расширенное взаимодействие с Python-инструментами и может выполнять высокоточные вычисления, что делает её незаменимой в задачах вроде математического анализа или разработки программного обеспечения. В частности, в одном из бенчмарков Human Last Exam эта модель показала результаты, равные или даже превосходящие специализированных агентов Deep Research от OpenAI!

На данный момент эта мощная модель доступна всем пользователям ChatGPT Plus. Она заменяет более старые версии моделей GPT-4, уступая лишь мини-версиям o4 с меньшим объёмом вычислений, но очень привлекательной ценой использования.
GPT-4.1: новая модель для написания кода и анализа
Ещё одной значимой новинкой от OpenAI стало представление модели GPT-4.1 — мощного инструмента, ориентированного на генерацию кода. Эта модель призвана заменить предыдущую версию GPT-4 и уже доступна через API, а также в интерфейсе ChatGPT.
Что нового? Прежде всего GPT-4.1 получила значительное обновление контекстного окна — теперь она может работать с объёмами до 1 миллиона токенов. Это настоящий прорыв в возможностях считывания и обработки больших объёмов информации. На практике это означает, что модель может находить ключевую информацию даже в длинных документах, анализировать технические спецификации или целые проекты без потери качества.
Кроме того, GPT-4.1 значительно улучшила эффективность генерации кода. Если предыдущая версия часто включала лишние шаги и «шум» в результате (в среднем 9% ненужного кода), то GPT-4.1 снизила этот показатель до 2%, что говорит о высокой точности и структурированности её решений. В тестовом примере генерации интерфейса для флеш-карт новая версия создала более интуитивный, удобный и современный результат, чем GPT-4.

OpenAI также представила мини и нано версии GPT-4.1 — облегчённые варианты модели, доступные по сниженным тарифам. Эти решения ориентированы на команды разработчиков и стартапы, которым нужна высокая производительность по доступной цене.
ChatGPT и работа с визуальным контентом
Одно из самых впечатляющих обновлений, которое получил ChatGPT с моделью o3 — это расширенный функционал работы с изображениями. Речь идёт не только о возможности загружать картинку для анализа, а о полноценном взаимодействии с визуальным контентом: распознавание объектов, сравнение, кропинг, масштабирование, а также генерация новых изображений.
В ChatGPT появилась встроенная библиотека изображений, которая доступна как в веб-версии, так и в мобильном приложении. Это своеобразное «место силы» для дизайнеров, маркетологов, контент-креаторов, ведь пользователи могут сохранять, редактировать и повторно использовать изображения прямо в интерфейсе.
Ещё одна впечатляющая демонстрация: модель получает фото с портовым пейзажем и выполняет глубокий анализ (ниже скриншот). Она определяет локацию, идентифицирует корабли, находит самый большой из них, определяет направление движения — и всё это шаг за шагом, используя визуальный зум и Python-код. Такая интеллектуальная визуализация открывает новые горизонты в аналитике, образовании и исследованиях.

ChatGPT — приложение №1 в мире и новая AI-соцсеть?
OpenAI уверенно закрепляет позиции лидера в сфере искусственного интеллекта. По словам Сэма Альтмана, количество пользователей ChatGPT достигло 800 миллионов. То есть каждый 10-й житель планеты уже хотя бы раз обращался к этому инструменту. С запуском o3 и обновлённого функционала для генерации изображений, прирост новых пользователей только ускорился.
Отдельного внимания заслуживает заявление Альтмана о создании новой социальной сети на основе AI. Этот проект задуман как альтернатива Instagram, X (Twitter) или Facebook, но с главным отличием — фокусом на искусственно сгенерированные изображения. Суть платформы будет заключаться в обмене AI-контентом, созданным в ChatGPT: иллюстрациями, аватарами, артами, мемами и другими формами визуального самовыражения.
Появление такой соцсети выглядит логичным: ChatGPT уже генерирует миллионы изображений ежедневно, а потребность пользователей в простом способе обмена этим контентом — очевидна. В сочетании с мощными AI-инструментами, возможность создать, отредактировать и поделиться изображением за несколько секунд выглядит как следующий шаг в эволюции цифрового общения.
Google vs OpenAI: битва за лидерство в искусственном интеллекте
На фоне успехов OpenAI корпорация Google тоже не отстаёт. После презентации Gemini 2.5 компания показала целый арсенал AI-инноваций, которые уже интегрируются в продукты Google Workspace и среду разработки.
Одно из крупнейших достижений — запуск Agent Space. Это персонализированная среда, позволяющая создавать AI-агентов, работающих с вашей корпоративной или личной информацией. Интерфейс напоминает NotebookLM, но функциональность значительно шире: доступ к Gmail, Google Drive, Calendar, а также внешним инструментам, таким как Confluence или Outlook.

Google также представила Agent Development Kit — набор для создания собственных агентов. Кроме того, реализован протокол agent-to-agent, который позволяет различным агентам взаимодействовать между собой. Это открывает новые возможности автоматизации бизнес-процессов, поиска персонала, организации встреч и даже проверки бэкграунда кандидатов — и всё это через обычный чат.

Отдельный прорыв — Google Workspace Flows, который позволяет автоматизировать задачи в Google Документах, Таблицах, Формах и Gmail. С помощью интерфейса Gemini вы можете просто ввести инструкцию — и AI самостоятельно выполнит рутинные действия: заполнит таблицы, создаст события в календаре, проанализирует письма или даже распознает информацию со скриншота.

На данный момент Google укрепляет позиции в сегменте:
- автоматизации рабочих процессов;
- генерации видео через VO2;
- персонализированных агентов;
- корпоративных AI-решений.
Видеогенерация нового уровня: обзор инструментов от Google VO2, Kling 2.0, PICA
Генерация видео с помощью искусственного интеллекта перестаёт быть экспериментом и превращается в полноценный инструмент для креаторов. В 2025 году 3 компании стали флагманами в этой сфере: Google, Kling и PICA.
Google VO2
Модель VO2 от Google уже доступна для широкого круга пользователей через AI Studio. Она позволяет создавать анимации до 8 секунд из текстовых подсказок. Отдельный инструмент WISC Animate предоставляет возможность оживлять ранее сгенерированные изображения, создавая динамичные, вирусные видео.
Google также позволяет работать с видео без лишних технических настроек — просто выберите формат, стиль, продолжительность и нажмите «Создать».
Kling 2.0
Китайская компания Kling представила версию 2.0, которая принесла такие инновации, как:
- Multi Editing Element — редактирование отдельных объектов в видео;
- Colors 2.0 — улучшенное воспроизведение цветов;
- Master Prompt Understanding — более точная интерпретация промптов.
Эти возможности позволяют не просто генерировать видео, а редактировать его «на лету»: убирать объекты, добавлять новые, менять фон и сценарий.
PICA
PICA сделала ставку на эмоциональный, вирусный контент. Их новый функционал позволяет загрузить до 5 изображений и превратить их в короткий видеосценарий. Также реализована доанимация элементов: можно взять видео, дать команду анимировать отдельный объект — и система интегрирует это действие в общий сюжет.
Kree.ai
Среди всех AI-платформ, работающих с визуальным контентом, Kree.ai выделяется гибкостью, скоростью обновлений и ориентацией на креативное сообщество. В 2025 году сервис представил несколько важных инноваций, которые превращают его в универсальную платформу для генерации и редактирования изображений и видео.
Основные функции Kree.ai:
- стилизация видео: возможность применять различные визуальные стили к видео (рисованное, живописное, футуристическое, ретро и т.д.);
- интеграция с Gemini: доступ к инструментам in-painting, редактирования, удаления объектов;
- конвертация 2D → 3D: преобразование плоских изображений в полноценные 3D-модели с возможностью экспорта в популярных форматах;
- создание 3D-сцен: построение целых композиций с использованием in-line редактирования;
- собственные LoRA-модели: обучение моделей для стилизации контента под собственные нужды.
Kree позволяет создавать уникальные изображения для:
- обложек видео;
- рекламных материалов;
- персонализированных иллюстраций;
- 3D-анимаций.
Это не просто генератор изображений, а полноценная среда для творчества с поддержкой глубокой кастомизации.

Таким образом, 2025 год стал годом прорыва для многих AI-платформ. В то же время OpenAI с моделью o3 и GPT-4.1 подтвердила своё лидерство, а Google уверенно врывается на рынок корпоративных решений. Игроки вроде Kling, PICA и Kree.ai задают новую планку в сфере визуального контента. AI становится не просто инструментом, а полноценной экосистемой для бизнеса, творчества и повседневной продуктивности.
Источник для статьи: https://openai.com/index/introducing-o3-and-o4-mini/.

