Tenqri
Baş sahypa
Dünýä

Гонка ИИ — все только начинается

На WWDC Apple наконец показала умную Siri. Ту самую, которую обещали ещё в 2024 и которую два года переносили. Теперь это переписанный с нуля ассистент: понимает контекст на экране, работает с личными данными, выполняет действия внутри приложений. Приложение Passwords само ходит по сайтам и меняет н

0 görüşkz.kursiv.media
Гонка ИИ — все только начинается
Paylaş:

На WWDC Apple наконец показала умную Siri. Ту самую, которую обещали ещё в 2024 и которую два года переносили. Теперь это переписанный с нуля ассистент: понимает контекст на экране, работает с личными данными, выполняет действия внутри приложений. Приложение Passwords само ходит по сайтам и меняет небезопасные пароли. Камера через Visual Intelligence реагирует на то, что видит Реакция была предсказуемой. Наконец-то. Догнали. Хотя на прямой вопрос из зала про агентов Apple честно ответила, что система пока в основном построена на запросах, а не на действиях. И модели под капотом обучены с помощью Google Gemini как учителя, а флагманская облачная версия считает на чужом железе, на чипах NVIDIA в облаке Google, за что Apple по оценкам платит около миллиарда долларов в год Весь разговор про то, опоздала Apple или нет, держится на одном допущении. Что мы уже понимаем, как выглядит победа в ИИ.А это совсем не очевидно Последние месяцы стало модно обсуждать, кто выигрывает гонку. Список победителей выглядит предсказуемо. Смотрят на размер моделей, качество ассистентов, объём инвестиций, количество GPU, дата-центры, капитализацию. Apple на этом фоне регулярно оказывается среди отстающих. Нет своей публичной модели масштаба GPT или Gemini. Нет ассистента, который считается лучшим. Apple Intelligence во многом опирается на чужие модели. Вывод напрашивается сам: проигрывает.Проблема в том, что вся эта оценка считает очки по метрикам, которые мы сами назначили конечными История технологий показывает одну закономерность. Рынок неплохо определяет направление. Ошибки начинаются позже, когда приходит время понять, где именно создаётся основная ценность и кто её удержит. В интернет-бум смотрели на количество пользователей, но деньги собрали те, кто построил инфраструктуру поверх трафика. В бум соцсетей считали аудиторию, а выиграли те, кто превратил её в рекламную машину. Промежуточный показатель почти всегда оказывался реальным, но не там, где его ставили на табло. Сегодня на табло модели, вычисления и GPU. Вопрос ровно тот же. Это источник ценности или только условие входа в игру.Сам по себе подход не ошибочный. Размер модели имеет значение. Вычисления имеют значение. Инфраструктура имеет значение. Но между важным фактором и источником устойчивого преимущества большая дистанция. Самый большой дата-центр не означает лучший бизнес. Самая большая модель не означает новую экономику. Самый умный ассистент не означает устойчивое преимущество Здесь полезно вспомнить Аджемоглу. Его позицию часто упрощают до скепсиса по поводу ИИ, хотя речь о другом. Вопрос не в том, изменит ли ИИ экономику. Вопрос в том, как быстро и в каком масштабе. И его оценка масштаба резко расходится с рыночным нарративом. В работе «The Simple Macroeconomics of AI» он считает, что за десять лет ИИ даст прирост ВВП около 1,1 процента и примерно 0,05 процента прироста производительности в год. Не ноль, но далеко от обещаний, под которые поднимают капитал. И спустя полтора года, уже глядя на первые агентские продукты, он эти цифры не поднял. Главным недостающим сигналом он называет не мощность моделей, а отсутствие приложений, которые делают ИИ простым в использовании и переводят сырую возможность в повседневную работу. Тех самых, что в своё время сделали повсеместным обычный офисный софт Для инвестора это неприятная мысль. Она заставляет смотреть не на возможности технологии, а на её отдачу. И риторика на Уолл-стрит постепенно меняется. Ещё недавно разговор был простым: больше вычислений лучше, больше GPU лучше, больше инвестиций лучше. Теперь всё чаще звучит другое. Где производительность. Где рост прибыли. Где возврат на капитал. Где экономический эффект от сотен миллиардов, вложенных в инфраструктуру. Рынок не перестал верить в ИИ. Он переходит от восхищения технологией к оценке её экономики Пока индустрия в основном обсуждает качество ответов. Насколько хорошо система пишет, как держит контекст, как рассуждает, насколько естественно ведёт диалог. Всё это важно, но мы постепенно начинаем путать интеллект с разговором об интеллекте. Чат-бот напишет тебе черновик письма. Агент сам найдёт нужную ветку переписки, подтянет данные из календаря и отправит. В какой-то момент главным станет не то, насколько хорошо система отвечает, а то, насколько хорошо она действует Когда ИИ начинает что-то делать сам, цена ошибки меняется. Ошибка чат-бота вызывает раздражение. Ошибка агента приводит к потере денег, утечке данных или сбою бизнес-процесса. Проблема перестаёт быть про качество модели и становится про надёжность. Про способность системы действовать в условиях неопределённости, не создавая новых рисков. Именно поэтому по-настоящему надёжного универсального агента пока нет ни у кого. Google показывает агентный апдейт Android, Apple показывает агентную Siri, OpenAI давно в этой гонке. Попыток много. Потолок надёжности не взят ни одной Показательнее всех тут Anthropic, которая сейчас на самом хайпе. Claude уже пишет код через параллельные репозитории и работает автономно по несколько дней на одну команду. Но когда дело дошло до действий на компьютере пользователя, компания сама написала, что эта часть пока сырая по сравнению с работой с текстом, что агент ошибается и риски меняются на ходу. И решение там не в том, чтобы сделать модель умнее, а в том, чтобы запереть её в песочницу, которую контролирует клиент, внутри границ его инфраструктуры. То есть надёжность снова добывается не из размера модели, а из контроля над средой, где модель действует. Ровно та логика, которую разворачивает Apple, просто с другого конца Архитектура новой Siri показывает, куда смещается центр тяжести. Под капотом не одна большая нейросеть, а пять специализированных моделей и оркестратор над ними. Лёгкая модель на 3 миллиарда параметров на устройстве для бытовых задач, модель на 20 миллиардов с подгрузкой только нужных фрагментов под запрос, облачные модели потяжелее для сложных сценариев и генерации изображений, и самая мощная для длинных логических цепочек. Но главное здесь не модели, а оркестратор. Диспетчер внутри операционной системы, который разбирает запрос и решает, что выполнить локально, что отправить в облако, к какому приложению обратиться. Самая сложная и самая ценная часть это не отдельная модель, а слой, который связывает их с реальными действиями в системе. И этот слой Apple держит у себя Большинство моделей учатся на том, что люди пишут, говорят и спрашивают. Но есть другой тип данных. То, что люди делают. Какие решения принимают, что открывают и закрывают, что отменяют, откладывают, выбирают. Это данные не про намерения, выраженные словами, а про реальное поведение. И у Apple одна из крупнейших позиций по такому типу данных, просто потому что миллиарды людей живут внутри её устройств каждый день. Только этот массив у Apple есть, а доступа к нему для обучения она себе не оставила, и это сознательно Apple архитектурно запретила себе обучать модели на пользовательских данных. Private Cloud Compute, через который проходят тяжёлые запросы, устроен как stateless-система: данные обрабатываются и стираются, не пишутся в логи, не уходят в обучение будущих моделей, и Apple публикует исходный код, чтобы это могли проверить независимые исследователи. Даже когда самые тяжёлые задачи считаются на чужом железе, на серверах Google с чипами NVIDIA, запрос идёт в криптографически изолированный контейнер, к которому Google доступа не имеет. Конкурент, который собирает поведение пользователей в обучение, наращивает модель на реальных действиях миллионов людей. Apple от этого ресурса отказалась сознательно. По метрике «самая обученная модель» она проигрывает заранее и по собственному выбору Но та же архитектура создаёт другой актив. Агенту, который лезет в твои письма, фото и сообщения, чтобы действовать за тебя, нужна не максимальная модель, а гарантия, что он не сольёт и не запомнит твои данные. Apple контролирует слой, на котором агент вообще выполняет действия. Операционную систему, чип, права доступа, песочницу, интерфейсы между приложениями. Оркестратор Siri это он и есть на практике. Надёжному агенту не обязательно знать о тебе всё в облаке, если он работает прямо внутри системы, где уже лежат твои приложения, файлы и разрешения. Раздел выше упирался в надёжность как в главную нерешённую проблему индустрии. Контроль над слоем исполнения это рычаг, который превращает надёжность из свойства модели в свойство системы. Здесь у Apple позиция, которой нет почти ни у кого. Вопрос только в том, сумеет ли она ей воспользоваться, или снова застрянет на исполнении, как застряла с Siri на два года.Уважение вызывает уже то, что Apple не пошла по стандартному пути. Догнать конкурентов было бы проще, если убрать ограничение на приватность. Apple его не убрала История про то, что Apple проигрывает гонку, выглядит слишком упрощённой. Гонку моделей она, возможно, проигрывает. Гонку ассистентов тоже. Гонку эффектных демо точно. Но все эти выводы держатся на допущении, что именно эти соревнования определят победителя. А это далеко не факт Через пять или десять лет решающим фактором может оказаться не самая большая модель и не самый красивый интерфейс, а способность надёжно встроить ИИ в реальные процессы и повседневные действия миллиардов людей. Главным активом могут стать данные о поведении, а не данные о запросах. А победителя вообще определят по метрикам, которые сегодня почти никто не обсуждает Рынок уже довольно уверенно называет победителей. Только до конца не ясно, понимает ли он правила самой игры

Diğer Haberler