Startup Jedi
Мы общаемся со стартапами и инвесторами, а вы перенимаете опыт.
Вместе с гостем очередного выпуска аудиоподкаста «Как по Маслоу» CEO группы компаний EORA, занимающейся разработкой и внедрением решений на основе машинного обучения (обработка естественного языка, машинное зрение, Data Science), Романом Дорониным погрузимся в историю искусственного интеллекта, узнаем об основных сферах его применениях и будущем развитии.
Startup Jedi
Мы общаемся со стартапами и инвесторами, а вы перенимаете опыт.
Благодаря фильмам вроде «Терминатора» люди думают, что искусственный интеллект — это зло, которое может уничтожить человечество. Но на самом деле то, что показывает кинематограф, может произойти в реальном мире с очень низкой вероятностью.
В 1954 году биологи препарировали кальмара и извлекли клетку мозга, которая называется «нейрон». После изучения его строения и состава были обнаружены дендриты и аксон. Дендриты — это принимающие отростки, собирающие импульсы от других нейронов и передающие их телу нейрона, а аксон — единственный передающий отросток, через него импульс идет от тела клетки к другому нейрону.
В процессе исследования ученые задались вопросом: возможно ли выйти на решение интеллектуальных задач совершенного уровня, повторив архитектуру нейрона, — ведь именно это наравне с ленью движет человеческий прогресс. Соответственно, теория нейросетей начала развиваться именно с того момента, когда ученые попытались воспроизвести процессы, происходящие в нашем головном мозге.
В 1956 году был организован Дартмурский семинар, где собрались лучшие ученые умы, среди которых были основатели IBM. Семинар был организован с целью принятия решения о дальнейшем будущем машин и того, как сделать их умнее. Мероприятие длилось 2 месяца и предполагалось, что за это время ученые научат машину говорить, считать и понимать естественную речь: для этого было определено 7 больших шагов, но ни один из них не был достигнут. Считается, что именно тогда началась история искусственного интеллекта.
...
Все мифы появляются там, где случается ошибка. Суть ошибки для искусственного интеллекта заключается во всеобщем заблуждении о том, что он должен быть создан по образу и подобию человеческого мозга — а это, соответственно, приведет в будущем к конкуренции с людьми. Другая теория также говорит, что машины будут самообучаться.
Правда же состоит в том, что машина не может учиться самостоятельно, даже когда мы говорим о хитром машинном обучении — «reinforcement machine learning» — методе, похожем на искусственный интеллект, поскольку программа обучается самостоятельно. В этом году данная методика показала выдающиеся результаты и уже сегодня применима в любой ограниченной среде, содержащей цель, и которую можно полностью описать. Это значит, что «reinforcement machine learning» может быть использован в играх и беспилотниках. На мой взгляд, у этого вида обучения будут и другие применения. Однако, теория о том, что искусственные системы могут обучаться самостоятельно — миф.
Также выдумкой является то, что они могут быть похожи на людей и развиваться в таком же русле. Поскольку для нейросети даже в одной модели, умеющей искать дырки в нефтепроводах, фотошопить лицо на фотографиях, разговаривать и одновременно прогнозировать погоду потребуется огромная вычислительная мощь.
Следующий миф говорит о том, что система может самостоятельно выходить за рамки задачи. Если выражаться на простом языке, то ошибочно думать, что Алиса поможет вашему ребенку выполнить домашнее задание по английскому языку. Система сможет помочь только косвенно, поскольку умеет переводить слова, но полностью выполнить задание у нее не получится — ведь она не предназначена для этой цели.
...
Для начала нужно определиться с тем, что мы подразумеваем под данным термином.
Искусственный интеллект — это не антропоморфное существо, похожее на человека, которое учится самостоятельно. Это сложная компьютерная программа, которая базируется на принципе «машинного обучения». Машинное обучение — огромный технологический раздел, который дает машине большое количество данных и учит находить в них закономерности: например, отличать кошку от собаки, прогнозировать что-либо и предугадывать, основываясь на истории событий. Так, загрузив в машину все данные, начиная от рейсов, погоды и заканчивая новостями, можно предсказать задержку самолета.
Следующий термин в понятии искусственного интеллекта — «машинное зрение», что по технологии и функционалу похоже на человеческие глаза. Также под искусственным интеллектом подразумевается «процессинг и обработка естественного языка». В момент, когда вы что-то «гуглите» или спрашиваете у голосового ассистента, система превращает ваш запрос в текст и после направляет на серверы, которые могут дать вам релевантную информацию. Например, тот же Google уже давно совершает поиск не по ключевым словам, а по смыслам, которые заложены в ваш запрос.
Data science также относится к искусственному интеллекту: работает с данными, интерпретирует их, строит прогнозы на основе баз данных, выявляет в них зависимости и так далее.
В итоге data science, «машинное зрение» и «процессинг и обработка естественного языка» — это три направления, каждое из которых называется искусственным интеллектом.
...
Машинный слух также можно отнести к трем главным направлениям искусственного интеллекта, поскольку он базируется на «машинном обучении». По сути, в телефоне каждого человека есть микрофоны, такие своеобразные «уши». И если компьютерное зрение развито очень широко, то машинный слух может быть куда более совершенным.
Машинный слух — недооцененная технология, потому что с помощью этого направления можно определять, где находится человек, а также различать людей, выявлять позитивные или негативные эмоции, а по тону голоса понимать смысл и контекст. Как, например, есть люди, умеющие только по звуку выявлять поломки или тип патронов конкретного автомата.
Я думаю, что ученые начнут больше двигаться в этом направлении, поскольку голосовым ассистентам просто необходим «машинный слух», как более сложная система.
...
На мой взгляд, искусственный интеллект будет востребован везде. Следует отметить, что сейчас на пике популярности находятся чат-боты. Такие голосовые ассистенты, как Алиса, Siri, Google и другие — все это сложные чат-боты, поскольку работа идет именно с текстом.
Если же мы говорим про бизнес-решения, то необходима автоматизация и коммуникация. Например, в контактном центре «Додо пицца» на треть звонков отвечает робот. И это является очень серьезной помощью в масштабировании большей компании, а также в скорости обслуживания.
Сейчас люди настолько избалованы, что им хочется получать ответ на жалобы и другие обращения где угодно, когда угодно и с максимальной скоростью. Наша компания EORA нашла решение для этого. На данный момент всю коммуникацию автоматизировать нельзя — ведь всегда есть сложные вопросы с подвохом. Мы автоматизировали то, что возможно, а в других моментах на помощь приходят наши сотрудники. Каналы, аккаунты в соцсетях, включая ленту и комментарии, сайты (например, Банки.ру) «складываются» в одно место, после чего специальная модель ранжирует очередь сообщений по нескольким параметрам:
Негативные комментарии обрабатываются в течение 5–6 часов, а позитивные — 12 часов. Клиент видит, что на сторис в инстаграме ему отвечают за считанные минуты и если его отзыв изначально был негативный, то быстрая реакция сразу же повышает лояльность человека.
Также data science используется очень широко в банковской тематике для построения прогнозов и применяется как рекомендательная система в интернет-магазинах, когда сайт подсказывает покупателям товары исходя из их предпочтений.
И наконец, одним из самых распространенных направлений искусственного интеллекта является «машинное зрение». Пример использования — при контроле над соблюдением скоростного режима на дорогах: искусственный интеллект с помощью камеры фиксирует номер автомобиля, «пробивает» его по базе, находит владельца и формирует счет на оплату штрафа о превышении скорости.
Любое распознавание текстов — это «машинное зрение». Каждый раз, когда человек смотрит в камеру своего телефона, происходит сегментация лица, одежды и фона — именно поэтому получаются такие хорошие фотографии. Как только пользователь открывает камеру в телефоне, она начинает беспрерывно снимать. Даже в момент использования маски в Instagram специальная нейросеть сегментирует лицо человека, предсказывает повороты его головы, чтобы двигаться вместе с маской в реальном времени.
...
На данный момент одной из самых опасных является технология deepfake. Используя ее можно представить любую информацию от лица, например, известного политика. Чтобы понять, о чем я говорю, достаточно набрать в строке браузера «deepfake politics». Существуют видеоролики, где президенты стран говорят, если не своим, то очень похожим голосом и довольно правдоподобно двигают губами.
Deepfake объединяет в себе два понятия: глубокое обучение (Deep learning), то есть обучение нейросетей, и подделку (Fake). Это поддельный, синтетически произведенный медиаконтент с наложением лиц и голосов, как правило, известных людей на фото- и видеоматериалы различного содержания с применением технологий искусственного интеллекта.
Также следует упомянуть относительно недавно представленный лабораторией OpenAI алгоритм GPT-3, умеющий генерировать правдоподобные новости и тексты на английском языке, практически неотличимые от человеческого уровня, — по этой причине OpenAI не открывает полный доступ к модели, так как боится, что технологию можно использовать для дезинформации.
Однако до того момента, когда машины будут за нас писать тексты, — еще очень далеко. Конечно, они уже умеют их генерировать, но при задании машине команды написать текст про конкретные события — результат будет состоять исключительно из фактов и абсолютно невозможен к прочтению.
Вместе с тем существует проблема и в другой плоскости. Например, интернет-портал из Воронежа использует нейросеть, умеющую бесконечно генерировать новости, близкие к полному абсурду. После чего редакция выкладывает в сеть неправдивые материалы, в которые люди охотно поверят, поскольку отсутствует проверка фактов. И это может привести к появлению fake news в неконтролируемом количестве.
...
Да, ведутся работы над созданием такой нейросети. Однако это борьба, которая в один момент может стать бесконечной: пока один выкладывает алгоритм, по которому можно вычислить deepfake, другой тут же разработает алгоритм, который его обойдет. И с каждым днем это будет только прогрессировать.
У Facebook есть гранты на разработку системы anti-deepfake по любому направлению, будь то текст, голос или генерация текстов. Но на сегодняшний день как бороться с этой технологией понятно не до конца. И поскольку весь мир живет в эпоху fake news и deepfake — люди, обладающие фактами и проверенной информацией буквально на вес золота.
...
Если вспомнить историю с выборами Трампа, то там использовали data science в чистом виде: его команда поделила людей на множество групп, выявила признаки этих микрогрупп и под каждую из них разработала свои призывы и материалы — таким образом они пошатнули систему.
Но именно наблюдая за социальными явлениями становится все более заметно, как стирается грань нормальности. Человек так и не привык находиться в нынешней среде, из-за чего кратно выросло количество психологических проблем. Общество довольно долгое время было относительно стабильным или хотя бы предсказуемо стабильным, а сейчас технологии обогнали все зримые скорости. И с каждым днем мир все больше и больше ускоряется, поэтому люди не очень понимают, как дальше жить.
Для примера возьмем диссонанс людей, которые смотрят на себя и свои возможности, а после листают ленту в Instagram. После чего опять смотрят на свою жизнь и впадают в депрессию, поскольку не знают, что с этим делать. По их ощущениям весь мир живет хорошо, а они плохо, хотя это обычная когнитивная ошибка.
...
На самом деле, перспектива в общем и целом довольно интересная. Искусственный интеллект, как снежный ком, летит очень быстро. Мы еще не умеем его контролировать. Мы не привыкли в нем жить и куда-то катимся. Сложно сказать, достаточно это позитивно или нет. Из негативного можно сказать, что у человечества есть ресурс самоуничтожиться — и вот это действительно страшно.
В остальном мы идем по пути здравой лени — это значит, что вся рутина будет автоматизирована. И на мой взгляд, творческие профессии никуда не уйдут, а наоборот, будут только расцветать, потому что появится больше времени и возможностей.
Искусственный интеллект позволит по чуть-чуть улучшать некоторые процессы, благодаря чему у людей будет высвобождаться время. На момент, когда будет достаточное количество данных, появится возможность повысить долголетие. Также за счет оптимального построения маршрутов и сложной логистики, можно будет еще больше снизить цены на билеты. А генерация новых молекул приведет к изобретению универсальных лекарств, которые будут идеально подходить под человека.
Нас определенно ждет более увлекательное будущее, чем у других поколений, живших до этого времени, потому что у них не было даже приблизительно тех возможностей, которые у нас есть сейчас.
Послушать полную версию аудио-подкаста можно здесь.
Facebook: facebook.com/Startup.Jedi.ru/
Telegram: t.me/Startup_Jedi_RU
Twitter: twitter.com/startup_jedi
Комментарии