Крупные технологические компании вкладывают миллиарды в инструменты машинного обучения

Следовать за такой быстро развивающейся отраслью, как искусственный интеллект, непросто. Пока искусственный интеллект не сможет справиться с этой задачей за вас, предлагаем вам перевод обзора новостей прошедшей недели из мира машинного обучения от TechCrunch.

Если это не было очевидно ранее, то конкурентная обстановка в области искусственного интеллекта, особенно в сегменте, известном как генеративный искусственный интеллект, накаляется. На этой неделе Dropbox запустил свой первый корпоративный венчурный фонд, Dropbox Ventures, который, по заявлению компании, будет сосредоточен на стартапах, создающих продукты на основе искусственного интеллекта. В ответ Amazon Web Services (AWS) представила программу на сумму 100 миллионов долларов для финансирования инициатив по генеративному искусственному интеллекту, которые реализуют партнеры и клиенты компании.

В пространстве искусственного интеллекта вращаются огромные деньги. Salesforce Ventures, венчурное подразделение компании Salesforce, планирует вложить 500 миллионов долларов в стартапы, разрабатывающие технологии генеративного искусственного интеллекта. Компания Workday недавно добавила 250 миллионов долларов в свой существующий венчурный фонд, чтобы активно поддерживать стартапы, занимающиеся искусственным интеллектом и машинным обучением. Кроме того, Accenture и PwC объявили о планах инвестировать 3 миллиарда и 1 миллиард долларов в область искусственного интеллекта.

Но возникает вопрос, являются ли деньги решением проблем в области искусственного интеллекта.

На панельной сессии, которая проходила на конференции Bloomberg в Сан-Франциско на этой неделе, Мередит Уиттакер, президент приложения для безопасного обмена сообщениями Signal, высказала мнение о том, что технология, лежащая в основе некоторых самых актуальных приложений искусственного интеллекта, становится непонятной. Она привела пример человека, который приходит в банк и просит кредит.

Этому человеку может быть отказано в кредите, и он "не имеет ни малейшего представления о том, что внутри банка скорее всего находится система, работающая на основе какого-то API от Microsoft, определившая на основе собранных данных из социальных медиа, что он не является платежеспособным," - сказала Уиттакер. "Он никогда не узнает об этом, ведь у него нет такой возможности".

Проблема не в капитале, а в текущей иерархии власти, утверждает Уиттакер.

Достичь структурных изменений гораздо сложнее, чем искать деньги, особенно когда структурные изменения не обязательно будут в пользу власти. Уиттакер предупреждает о том, что может произойти, если не будет достаточного сопротивления.

По мере ускорения прогресса в области искусственного интеллекта, усиливаются и общественные последствия, и мы продолжим двигаться по "гипнотизирующей дороге к искусственному интеллекту, где эта власть закрепляется и принимается как неотъемлемая часть интеллекта, и мы настолько охвачены наблюдением, что у нас остается очень мало возможностей влиять на нашу индивидуальную и коллективную жизнь" - сказала она.

Это должно заставить отрасль задуматься. Будет ли это действительно происходить - это уже другой вопрос. Возможно, об этом мы услышим, когда она выйдет на сцену на конференции Disrupt в сентябре.

Другие области машинного обучения

Профессор Университета Вашингтона, обладатель стипендии МакАртур, впервые обратила внимание на несколько неожиданных ограничений самых современных моделей. В частности, GPT-4 очень плохо справляется с умножением. Он неправильно находит произведение двух трехзначных чисел с поразительной частотой, хотя с небольшой помощью может получить правильный ответ в 95% случаев. Зачем нам важно, что языковая модель не умеет считать, спросите вы? Потому что вся рыночная индустрия искусственного интеллекта в настоящее время строится на предположении, что языковые модели хорошо обобщаются на множестве интересных задач, включая такие вещи, как подсчет налогов или бухгалтерия. Чои подчеркнула, что мы должны искать ограничения искусственного интеллекта, так как это больше говорит нам о его возможностях.

Остальные части её выступления были также интересными. Полное содержание выступления можно посмотреть в YouTube.

Было подано множество статей на конференцию CVPR (Computer Vision and Pattern Recognition Conference) и представлено много докладов. Вот что судьи конференции нашли наиболее интересным:

VISPROG, разработанный исследователями из AI2, является своего рода метамоделью, которая выполняет сложные задачи по визуальной манипуляции с использованием универсального набора инструментов кодирования. Представьте, у вас есть фотография гризли на траве (как на изображении) — вы можете сказать модели просто "заменить медведя на полярного медведя на снегу", и она начнет работать. Она идентифицирует части изображения, визуально разделяет их, ищет и находит или генерирует подходящую замену, а затем собирает все обратно, не требуя дополнительных указаний со стороны пользователя. Интерфейс "усиления" из фильма "Бегущий по лезвию" начинает казаться устаревшим. И это только одна из множества возможностей этой модели.

Компания Meta выпустила инструмент синтеза речи под названием Voicebox, который отлично справляется с извлечением особенностей голоса и их воспроизведением, даже если входные данные не являются идеальными. Обычно для воспроизведения голоса требуется достаточное количество разнообразных чистых голосовых записей, но Voicebox делает это лучше, чем многие другие, при меньшем объеме данных (достаточно всего около 2 секунд). К счастью, пока они держат этого джина в бутылке. Для тех, кто считает, что им может понадобиться клонирование своего голоса, рекомендуется ознакомиться с Acapela.

Источник: TechCrunch

 

АвторMOST MEDIA
Дата публикации26.06.2023
Поделиться
Подписка на ивенты

Укажите адрес Вашей электронной почты и мы будет отправлять уведомления о грядущих мероприятиях. Не волнуйтесь, спама не будет