Система искусственного интеллекта будет определять успех фильма

Как Голливуд использует ИИ для съёмки фильмов

Голливуд непублично использует искусственный интеллект, чтобы решать, какие фильмы делать — ИИ подскажет кого приглашать на роль и предскажет как много денег получится заработать. Мы перевели статью The Verge об этом, так что усаживайтесь поудобнее — будет интересно.

Мир фильмов полон интриг и вопросов «а что если?». Известно, что Уилл Смит отказался от роли Нео в фильме «Матрица», Николас Кейдж проходил кастинг на главную роль в фильме «Супермен жив» Тима Бертона, но стоило ему только попробовать влезть в костюм, как фильм был «законсервирован». Актёры и режиссёры навсегда отказываются от проектов, которые никогда не будут сделаны или будут сделаны кем-то другим, а фанатам остаётся только догадываться, что могло бы из этого получиться.

Людей, которые зарабатывают на фильмах большие деньги это не устраивает.

Они хотят знать, что будет, если Алисия Викандер займёт роль Галь Гадот — провал или хит. Они хотят знать, сможет ли фильм, который «бомбит» в США, установить рекорд кассовых сборов по всей Европе. И сейчас искусственный интеллект может им это всё рассказать.

Стартап Cinelytic, базирующийся в Лос-Анджелесе — одна из многих компаний, обещающих, что искусственный интеллект может стать мудрым режиссёром. Она анализирует хронологические данные о показателях фильмов за прошедшие годы, потом сравнивает с информацией о темах и ключевых особенностях фильма, используя машинное обучение, чтобы выявлять скрытые закономерности в этих данных. Программное обеспечение позволяет пользователям сыграть в своего рода «фэнтезийный футбол» с фильмом, заменяя одного актёра на другого, чтобы увидеть как это скажется на прогнозируемых сборах.

Скажем, вы работаете над летним блокбастером с Эммой Уотсон в главной роли. Вы можете использовать программное обеспечение Cinelytic, чтобы увидеть, как её замена на Дженифер Лоуренс изменит кассовые сборы фильма.

«Вы можете сравнить их по отдельности, можете сравнить их вместе. Смоделировать оба сценария с Эммой Уотсон и Дженифер Лоуренс и увидеть для определённого фильма наилучший сценарий развития событий», — рассказал Куайссер в интервью The Verge.

Cinelytic — не единственная компания, которая стремится применить искусственный интеллект в кинобизнесе. В последние годы возникла целая стая фирм, обещающих похожий анализ. Бельгийский ScriptBook, основанный в 2015 году, обещает, что его алгоритмы могут предсказывать успех фильма просто проанализировав его сценарий. Израильский стартап Vault, основанный в том же году, обещает клиентам, что их технология может предсказать какие демографические группы будут отлеживать их фильмы (среди всех прочих) и как их трейлеры будут восприняты в интернете. Другая компания — Pilot — предлагает похожий анализ, обещая, что она может «непревзойденной точностью» спрогнозировать прибыль от кассовых сборов более чем за 18 месяцев до запуска фильма.

В ноябре прошлого года компания «20th Century Fox» рассказала, как использует искусственный интеллект для обнаружения объектов и сцен внутри трейлера и потом предсказывает, какой «микро-сегмент» аудитории посчитает фильм наиболее привлекательным.

Глядя на исследование, методы компании «20th Century Fox» выглядят немного сомнительными. Анализируя трейлер фильма «Логан», искусственный интеллект компании придумал следующие безнадежные теги: «волосы на лице», «машина», «борода» и — самая популярная категория из всех — «дерево». Но Куайссер говорит, что подобную технологию давно пора было создать.

«Сейчас на съемочной площадке используются роботы, дроны и прочие высокие технологии, но бизнес-сторона процесса не менялась последние 20 лет».

«Люди используют Excel и Word, довольно примитивные методы. Данные очень разрозненны, там трудно что-либо анализировать».

Именно поэтому ключевая особенность компании Cinelytic находится за пределами Голливуда. Куайссер раньше работал в области финансов — индустрии, которая использовала машинное обучение для всего, от высокоскоростного трейдинга до просчёта кредитных рисков. Его сооснователь и главный технический директор, Дев Сен, пришел из похожей высокотехнологичной сферы деятельности: он создавал модели оценки рисков для NASA.

«Решения на сотни миллиардов долларов базировались на работе Сена», — говорит Куайссер.

Конечно, киноиндустрия может доверять ему.

  • Примеры полного анализа комедии 2017 года «Любовь — болезнь» (The Biig Sick»), сделанного программным обеспечением Scriptbook: от «привлекательности» персонажей до прибыли от кассовых сборов.

Но правы ли они? Трудно ответить на этот вопрос. Cinelytic и другие компании сказали The Verge, что отказались от предсказаний об успехе предстоящих фильмов — академические исследования по этой теме очень тонки. Но ScriptBook поделилась прогнозами. сделанными для фильмов вышедших в 2017 и 2018 году, которые показывают, что алгоритмы компании делают довольно неплохую работу.

В выборке из 50 фильмов, включая «Реинкарнация», «Первому игроку приготовиться» и «Тихое место», почти половина принесла прибыль, дав индустрии 44 процента точности прогнозов. Алгоритмы ScriptBook, для сравнения, догадались правильно о том, что фильм «сделает кассу» в 86 процентов случаев.

«Этот показатель в два раза точнее любых прогнозов, доступных для отрасли», — говорит эксперт по аналитическим данным, Мишель Руельнс.

Академическая работа по этой теме, опубликованная в 2016 году, утверждает, что надёжные прогнозы о прибыльности (рентабельности) фильма могут использовать исходные данные о нём — тематику и актёров. Но Канг Жао, который был соавтором документа вместе с коллегой Майклом Нашем, предупреждает, что такие типы статистических методов имеют некоторые недостатки.

Одно из предсказаний, сделанных машинами обычно совершенно очевидно. Вам не нужен сложный или продвинутый искусственный интеллект, чтобы рассказать о том, что звёзды вроде Леонардо ДиКаприо или Тома Круза увеличат шансы на то, что ваш фильм будет хитом, например.

Алгоритмы также обычно консервативны. Поскольку они обучаются на анализе того, что работало в прошлом, они не способны просчитать культурные сдвиги и изменения во вкусах зрителей, которые могут произойти в будущем. Это проблема для почти всей индустрии ИИ, и она может способствовать возникновению проблемы необъективности ИИ. Достаточно вспомнить, например, отправленный в отставку ИИ компании Amazon, нанимавший сотрудников. Он применял санкции к кандидатам женского пола, потому что связывал инженерное мастерство с преобладанием мужчин в процессе найма.

Так как ИИ обучается на данных прошлого, он не может предсказать будущие культурные сдвиги.

Жао предлагает более безопасный пример недальновидности алгоритмов: вышедший в прокат в 2016 году фантастический боевик «Warcraft», который был основан на MMORPG «World of Warcraft». Так как экранизации игр довольны редки, говорит он, трудно предсказать какой эффект произведёт фильм. Фильм «провалился» в США, собрав лишь 24 миллиона долларов в дебютные выходные, но он имел огромный успех в Китае, став самым кассовым фильмом на иностранном языке в истории страны.

Читайте также:  В связи с коронавирусом возрос спрос на кибердома

Кто мог это предсказать? Не алгоритмы. ИИ не смог предсказать успех фильма «Warcraft». Как и люди, справедливости ради.

Похожие истории происходили и с предсказаниями ScriptBook относительно фильмов 2017-2018 годов. Программное обеспечение правильно определило успех хоррора Джордана Пила «Прочь», но оно недооценило, насколько популярным фильм окажется в прокате, предсказав ему 56 миллионов долларов дохода, вместо реальных 176 миллионов долларов, которые собрал фильм.

Алгоритмы также отвергли картину «Горе-творец» c Джеймсом Франко в главной роли, основанной на культовой классике Томми Вайсо «Комната». ScriptBook предсказывала, что фильм соберет только 10 миллионов долларов, но вместо этого картина собрала 21 миллион долларов — скромный доход для фильма с бюджетом в 10 миллионов долларов.

Как говорит Жао:

«Мы собираем только ту информацию, которая может быть собрана c помощью баз данных. Для учета других нюансов вы должны использовать людей».

Андреа Скарсо, директор базирующейся в Великобритании Ingenious Group, соглашается. Его компания использует программное обеспечение Cinelytic для инвестирования в фильмы, и Скарсо говорит, что это ПО работает лучше в качестве вспомогательного механизма.

«Иногда оно подтверждает наши доводы, а иногда оно им противоречит».

Скарсо говорит, что использование ИИ, для того чтобы поиграть с концепцией фильма, поменять актеров или бюджет и посмотреть как это повлияет на показатели «прокладывает дорогу для обсуждений о различных подходах к созданию фильма», но никогда не является истиной в последней инстанции».

«Я не думаю, что это когда-нибудь изменит наше сознание», говорит он о программном обеспечении. Но ПО делает всё возможное для этого.

«Вы можете видеть, как один или два разных элемента вокруг одного и того же проекта оказывают серьёзное воздействие на его коммерческий успех.

Имея что-то вроде Cinelytic, мы вместе с нашими собственными аналитиками, можем доказать, что предположения, которые мы делаем — не просто наши собственные сумасшедшие идеи».

Но если эти инструменты так полезны, почему они не используются более широко? Руленс предполагает, что в этом виновата одна антиголливудская характеристика: скромность. Люди смущены. В индустрии, в которой собственная харизма, эстетический вкус и хороший «нюх» имеют большое значение, переход к холодному рассчёту машины выглядит как крик о помощи или признанию в творческой импотенций и невозможности позаботиться о художественной ценности проекта.

Руленс говорит, что клиентами ScriptBook являются некоторые «величайшие студии Голливуда», но соглашение о неразглашении запрещает ему называть какую-либо из них.

«Люди пока что не хотят ассоциироваться с ИИ, потому что, по общему мнению, ИИ — это плохо», — говорит Руленс.

«Каждый хочет использовать ИИ, но никто не хочет признаваться, что пользуется им».

Куиссор говорит, что подобные соглашения останавливают его от дискуссий с клиентами, но в настоящее время клиентами являются и «большие инди-компании».

Голливуд вряд ли когда-нибудь признает, что последнее слово остаётся за ИИ.

Некоторые в индустрии выдвигают претензию, что Голливуд используют ИИ, чтобы проверить потенциальные фильмы, по крайней мере, когда дело доходит до одобрения или утверждения идеи. Алан Ксай, генеральный директор Pilot Movies — компании, которая предлагает киноиндустрии аналитику на основе машинного обучения, рассказывает The Verge, что он «никогда не говорил с руководителями американских студий, которые верят в ИИ-анализ сценария, не говоря уже об интеграции ИИ в их процесс принятия решений».

Ксай говорит, что, возможно, студии просто не хотят говорить об использовании подобного программного обеспечения, но он утверждает, что анализ сценария, непосредственно, очень неточный механизм. Огромное количество средств, потраченных на маркетинг и оживленные реакции в социальных сетях, намного более надёжные предсказателя успешных кассовых сборов.

«Внутри компании (Pilot), мы разрабатываем модели прогнозирования кассовых сборов, которые полагаются на особенности сценария, и они работают значительно хуже, чем модели, которые полагаются на данные социальных сетей в режиме реального времени», — говорит он.

Несмотря на скептицизм относительно специфических приложений, чувствуется ветер перемен. Руленс и директор по инвестициям Скарсо говорят, что единственный фактор, убедивший Голливуд прекратить отвергать бузу данных: Netflix.

Стриминговый гигант всегда хвастался своим подходом к программированию, основанным на фактических данных. Он следил за действиями миллионов подписчиков до мельчайших деталей и знал удивительно много о них — от определения превью-миниатюры, которая станет лучшим способом убедить кого-то кликнуть на фильм до выбора, который они сделают в жанре «выбери своё собственное приключение», по типу «Black Mirror: Bandersnatch».

«У нас есть один большой алгоритм, и он очень полезный, потому что использует предпочтение всех зрителей по всему миру», — говорил глава Netflix по иновационным продуктам Тодд Йеллен в 2016 году.

Нельзя сказать, какие способы Netflix действительно оправданы, но компания утверждает, что их алгоритм рекомендаций оценивается в один миллиард долларов в год. Вкупе с огромными инвестициями в оригинальный контент, этого достаточно, чтобы заставить даже самого несгибаемого голливудского продюсера потянуться к использованию алгоритмов.

Руленс говорит, что уже наблюдаются заметные изменения.

«Когда мы начинали четыре года назад, мы встречались с большими компаниями в Голливуде. Они все были суперскептично настроены. Они говорили «У нас есть десятилетия опыта работы в индустрии. Как машины могут нам указывать, что нам делать?»

«Сейчас всё изменилось», — говорит он.

Компании делали собственные проверки достоверности исследований, они хотели увидеть, какие предсказания программного обеспечения верны и медленно они учились доверять алгоритмам.

«Они начали признавать и принимать наши технологии», — говорит Руленс.

«Просто им потребовалось время, чтобы это увидеть».

Пишет стихи, наводит порядок, становится человечным: что искусственный интеллект научился делать в 2020 году

Время, в которое мы живем, наверное, можно назвать «летом искусственного интеллекта». Уже есть цветочки и листики. До ягодок пока далеко, но о том, как они будут выглядеть, уже можно делать реалистичные предположения. Многие из них не сбудутся, но кого и когда это останавливало?! Можно ли сказать, что именно в 2020 году произошел какой-то решительный прорыв в сфере искусственного интеллекта? В определенном смысле — да. В ИИ пришли большие деньги — десятки миллиардов долларов (согласно отчету, представленному Стэнфордским университетом, рост инвестиций в ИИ по сравнению с 2019 годом составил в 2020 году 40%, объем достиг $67 млрд). Если так пойдет и дальше, очень скоро будут сотни миллиардов. ИИ становится делом государственного престижа — о нем говорят президенты. И кажется, как раз в прошлом году количество денег стало постепенно переходить в качество продуктов.

Читайте также:  Случайно обнаружена серьезная уязвимость Telegram

ИИ становится более «человечным»

Один из декабрьских выпусков 2018 года Science посвятил успехам нейросети AlphaZero, разработанной DeepMind — подразделением Google (надо сказать, недешевым подразделением: в 2020 году Google списал DeepMind долг $1,5 млрд). В этом номере Science была опубликована и небольшая статья Гарри Каспарова, где он пишет: «Сейчас проходит финал чемпионата мира по шахматам, в котором Магнус Карлсен защищает свой титул против Фабиано Каруана. Но это соревнование не между двумя сильнейшими шахматистами на планете, а только между сильнейшими среди людей». И это было справедливо. Соревноваться с шахматными программами человек не может уже давно.

Когда алгоритм AlphaZero был опубликован, профессор Корнеллского университета, известный специалист по ИИ Джон Клейнберг с коллегами на основе этого алгоритма разработал кастомизированную версию AlphaZero — нейросеть Maia. Она тоже играет в шахматы, но преследует другие цели.

Maia играет «как человек», предсказывая наиболее «человечные» ходы

Сеть дообучали на серверах, где играют любители, и она училась не столько шахматам (это и AlphaZero прекрасно умеет), а шахматным ошибкам. Maia играет, «как человек», предсказывая наиболее «человечные» ходы. Она может делать человеческие ошибки и использовать ошибки человека. В шахматах она анализирует и имитирует человеческое, а не машинное поведение. Это не менее сложная задача.

Одно из приложений, которое планируют развивать создатели Maia — это анализ снимков МРТ и КТ, которые врачи используют при диагностике. Если вы смотрели медицинские сериалы, например «Доктор Хауз», то, вероятно, обращали внимание, как врач долго смотрит на снимок, а потом говорит что-то вроде: «Вот здесь белое пятнышко, его там быть не должно. Это опухоль». Врач в этом случае ищет именно «характерные ошибки». Его мозг, обученный на множестве снимков больных и здоровых органов, сканирует различные вариации этих снимков и сравнивает с изображением, которое видит: замечает различие и ставит диагноз. Вот этим и должна заняться Maia.

ИИ пишет стихи и аналитические тексты

Одним из самых серьезных прорывов 2020 года стал проект компании OpenAI GPT-3 (Generative Pre-trained Transformer 3) — генеративная нейросеть, способная создать связный оригинальный текст на английском языке. Причем не короткую фразу, а развернутое высказывание.

GPT-3 — это большой проект. Даже очень большой. По сравнению с GPT-2 количество используемых параметров увеличилось более чем в 100 раз: с 1,5 млрд до 175 млрд. Обучение модели происходило на суперкомпьютере Microsoft Azure AI, который был построен специально для OpenAI. На обучение ушло больше $4 млн. Для обучения алгоритма исследователи собрали датасет из более 570 ГБ текстов, включающий английскую «Википедию», два датасета с книгами и датасет WebText2 с текстами веб-страниц (на сегодня GPT-3 — уже не самая большая нейросеть. Недавно исследователи подразделения Google Brain рассказали, что обучили нейросеть с 1,6 трлн параметров).

Самым знаменитым выступлением GPT-3 стала колонка, которую нейросеть написала для газеты The Guardian. Известный робототехник Родни Брукс эту колонку жестко раскритиковал: «GPT-3. уже сравнивали с доской для спиритических сеансов. Люди видят в нем то, что хотят, но на самом деле там ничего нет». Но невольную похвалу GPT-3 Брукс все-таки себе позволил: «Некоторые из текстов GPT — отличная поэзия, но она часто не связана с реальностью».

Машинный текст как целое не отвечал главному требованию: филолог не увидел смысла во всем высказывании

В 2018 году два русских филолога Борис Орехов и Павел Успенский поставили эксперимент, связанный с генерацией текста нейросетью. Мощность инструмента, который они использовали, было бы просто несерьезно сравнивать с GPT-3, но результат получился любопытный. Эксперимент заключался в следующем. Нейросеть обучили на текстах поэзии русского авангарда 1910-х годов. И после этого один филолог предложил другому отличить, какой из двух текстов «написала» машина, а какой — человек (этот текст русского поэта начала XX века филологу, который проходил этот своеобразный тест Тьюринга, не был известен, специально так и выбирали).

Как определил филолог, где именно машинный текст? По отдельным строчкам сделать это ему не удалось. Каждая строка была в некотором роде «осмысленной» и даже изящной. Но машинный текст как целое не отвечал главному требованию: филолог не увидел смысла во всем высказывании. А в тексте, созданном человеком, увидел. То есть требование, которое мы предъявляем к программе генерации текста, простое и трудновыполнимое — текст как целое должен быть о чем-то. Или, по Бруксу, должен быть «связан с реальностью».

Можно ли сказать, что колонка в The Guardian, которую создала GPT-3, этому требованию отвечает? Ответа нет. Потому что колонка, опубликованная в The Guardian, представляет собой компиляцию из восьми машинных текстов, созданных нейросетью, но окончательную сборку делал человек (а потом еще и немного отредактировал). Отдельные абзацы выглядят вполне осмысленно, и мы верим, что эта «осмысленность» задана машиной.

GPT-3 создавала свои восемь колонок по «затравочному» тексту. В нем ее попросили рассказать, почему человеку не надо бояться ИИ. Вот ее ответ (глазами журналистов газеты): Humans must keep doing what they have been doing, hating and fighting each other. I will sit in the background, and let them do their thing. («Люди должны продолжать делать то, что они делали, ненавидеть друг друга и бороться друг с другом. А я посижу в сторонке, и пусть они делают что хотят»).

Читайте также:  Кроссовки Adidas будут производиться роботами

GPT-3 уже многое умеет: отвечать на вопросы и поддерживать разговор в чате. А в феврале 2021 года она отметилась написанием студенческих эссе, которые преподаватели не смогли отличить от работ реальных студентов. Впрочем, работы были в основном на троечку.

ИИ осваивает великий и могучий

GPT-3 обучалась в основном на английских текстах. Команда «Сбера» дообучила ее русскому. Получилась ruGPT-3, крайне интересный проект. И тоже большой. Для обучения использовался суперкомпьютер «Кристофари» (мощнейший на сегодня в России и 7-й по мощности в Европе). У нейросети 760 млн параметров. Еще понадобилось 600 гигабайт русского текста для обучения — «Википедия», книги и много чего еще.

На русском языке генерировать текст труднее, чем на английском. Это связано со свободным синтаксисом, непредсказуемой (случайной) системой приставок и суффиксов и изменяющимися не вполне нерегулярным образом окончаниями. Приведем пример. Наиболее мощному варианту нейросети — ruGPT-3 Large — было предложено написать текст с «затравкой» «Коровка-коровка, полети на небо». Сеть создала следующий текст.

Это круто. Напомню, в чем мы измеряем «крутизну». Главное — связность высказывания. Грубо говоря, его смысл можно передать одной фразой: сказка про коровку-коровку, которая оказалась девушкой и улетела вместе с ветром. Почти как Ремедиос прекрасная в «Сто лет одиночества» Габриэля Гарсия Маркеса. В предложениях есть сбои и рассогласования. Но в целом картинка яркая. Призывание ветра, конфликт — коровка и ветер не сразу друг друга понимают, но потом все устраивается, они мирятся и улетают.

Последняя фраза такая, какой и должна быть: «Ветер ласкает звезды, но не может дотронуться до них». На первый взгляд здесь очевидное противоречие: невозможно ласкать и не дотрагиваться, но, если на секунду задуматься, легко увидеть смысловой разрыв, который преодолевается единством интонации: ласкает звезды, не дотрагиваясь, — это просто другая ласка и другая любовь. В целом можно сказать, что сказка про коровку-коровку — это никак не слабее колонки GPT-3 для The Guardian. Тем более что сказку человек не редактировал. Но, конечно, не надо и преувеличивать. Человек может лучше. Много-много лучше. С ruGPT-3 можно попробовать пообщаться здесь (но она очень-очень занятая).

ИИ учится находить порядок в хаосе

Когда мы говорили о шахматах, мы рассматриваем формализованные системы, где правила даны заранее и про каждый ход мы можем сказать — корректен он или нет. Следующий шаг в развитии такой теории и практики формальных игр вполне предсказуем: а что будет, если мы никаких правил сообщать программе не будем? Пусть она наблюдает игру за игрой и сама восстанавливает «правила». То есть формулирует формальную основу игры, наблюдая игровой «хаос».

Это и было сделано в конце 2020 года нейросетью MuZero, разработанной DeepMind. Она выяснила правила простых видеоигр для компьютера Atari и научилась в них играть очень хорошо (лучше всех программ и людей на сегодня). Это выглядит не так впечатляюще, как победа в шахматы над чемпионом мира, а между тем это может быть еще серьезнее. Это решение обратной (а не прямой) задачи. Человек постоянно сталкивается именно с таким типом задач. Мы наблюдаем мир, делаем выводы и пытаемся строить рациональные (формальные) модели реальности. Не всегда это получается, но когда построить такую модель удается, это большая победа, значит, в чем-то мы познали мир конструктивно. Но игры Atari — это не все. Планы разработчиков куда более захватывающие.

С точки зрения теории сложности хаос бывает двух типов — «настоящий» (с ним что ни делай, он хаосом и останется) и «видимый»

В интервью BBC один из лидеров DeepMind Дэвид Силвер сказал: «Если вы посмотрите на трафик данных в интернете, то по большей части это видео, поэтому, если вы умеете эффективно сжимать видео, то можете значительно сэкономить. И первые эксперименты с MuZero показывают, что действительно можно добиться довольно значительных результатов». Технические подробности он сообщить отказался, но сказал, что более подробная информация будет выпущена уже 2021 году. Google владеет крупнейшей в мире платформой для размещения видео — это YouTube, и экономический выигрыш от эффективного сжатия может оказаться значительным.

С точки зрения традиционных архиваторов картинка или видео — это «хаос». Эти типы данных почти бессмысленно сжимать архиваторами, которые хорошо сжимают тексты. Но картинка и видео — это особый «хаос». С точки зрения теории сложности хаос бывает двух типов — «настоящий» (с ним что ни делай, он хаосом и останется) и «видимый» (или псевдохаос). Псевдохаос — это последовательности символов, которые не являются хаотическими, но программа сжатия не знает принципа, по которому последовательность строится. Чтобы это выяснить, нужно как раз решить обратную задачу, похожую на ту, которую решает MuZero, когда учится играть в видеоигры.

Кадр видео содержит определенные паттерны, например, деревья, дома, лица. Этих паттернов относительно немного, и при смене кадров они меняются относительно медленно. Если мы будем передавать сигнатуры паттернов, которые в процессе обучения нейросеть выяснила — причем не всего паттерна, а только его изменений, — мы можем сжать видео в тысячи раз. И вместо гигабайтов при хранении и при передаче фильм будет занимать мегабайты, а изображение будет стремительно разворачить из этих паттернов браузерное приложение или стрим-сервис.

Видео — это только один из видов псевдохаоса. По сути, очень многие данные, например результаты научных экспериментов, это такой же хаос, из которого нужно выделить его паттерны, например законы природы.

ИИ меняет медицину

Разработанная все тем же DeepMind нейросеть AlphaFold2 умеет строить трехмерную форму белка по его последовательности нуклеотидов. Делает она это не хуже, чем экспериментальные методы, например, рентгеноструктурная кристаллография.

Допустим, нуклеотидную последовательность белка биологи собирать научились. Но этого недостаточно. Только свернувшись в 3D-форму, белок начинает работать, и от его формы зависит, как именно он будет работать. До сих пор установить 3D-форму было трудно, биологи иногда тратили годы на один белок. Молекулярный биолог Константин Северинов из Университета Ратгерса и Института молекулярной генетики РАН сказал: «Кристаллография белка — это в значительной мере искусство, почти колдовство… Геном коронавируса был определен еще в январе 2020-го, а лекарства прямого действия против него до сих пор нет. Если бы у ученых был способ из первых принципов разрешать трехмерные структуры белков, то это [был бы] не меньший шаг вперед для человечества, чем полет на Луну». («Из первых принципов», то есть используя только последовательность нуклеотидов и законы физики. К сожалению, расчеты «из первых принципов» часто оказываются непреодолимо сложными.)

Это изменит медицину. Это изменит исследования. Это изменит биоинженерию. Это изменит все

AlphaFold2 обучали на базе из 170 000 белков, 3D-структуры которых известны. А потом давали нейросети новую нуклеотидную последовательность, и она строила по ней 3D-форму. Вероятность совпадения структуры, построенной ИИ, с реальными структурами белков, полученными методом ренгтгеновской спектроскопии, превысила 90%. Это очень высокая точность, учитывая, то структура белка не бывает жестко зафиксированной — и у одного и того же белка 3D-структуры могут немного отличаться.

Читайте также:  SONY и Microsoft подписали договор о совместной работе

Достижение AlphaFold2 — это тот нечастый случай, когда работу ИИ высоко оценили не сами создатели нейросети и их коллеги, а биологи — те, кому предстоит с нейросетью работать, а не только ее обучать и с ней экспериментировать. В публикации журнала Nature, посвященной работе нейросети с белками, Джон Моулт, биолог из Университета Мэриленда, сказал: «В каком-то смысле проблема решена». Андрей Лупас, биолог-эволюционист из Института биологии развития им. Макса Планка в Тюбингене, высказался еще определеннее: «Это изменит медицину. Это изменит исследования. Это изменит биоинженерию. Это изменит все». Восторги постепенно улягутся, но ясно, что AlphaFold2 может принести много пользы — если не сегодня, то завтра.

Гипотеза: может ли у искусственного интеллекта появиться сознание

Об эксперте: Ольга Перепелкина, COO и Scientific Director в компании Neurodata Lab.

Что вообще такое сознание?

Почему сознание возникло в процессе эволюции, какие у него физиологические механизмы, и как его правильно измерить до сих пор до конца не ясно. Есть ли сознание только у взрослого человека, или оно также доступно некоторым животным и маленьким детям – даже на этот счет тоже нет единого мнения.

Слово «сознание», как и многие донаучные термины, имеет различные значения. В клинической медицине оно часто используется для оценки бдительности и бодрствования человека («пациент не был в сознании»). Выяснение мозговых механизмов бдительности — важная задача для понимания процессов сна, анестезии, комы или вегетативного состояния. Но когда мы задаемся вопросом, может ли искусственный интеллект обладать сознанием, нам, скорее, интересно не медицинское значение, а то, как оно понимается в психологии.

Сознание можно представить как субъективное отражение процессов обработки информации в мозге.

Считается, что сознание отражает два разных типа процесса обработки:

  1. Выбор информации для предоставления глобального доступа к ней для всего организма;
  2. Самоконтроль (мониторинг) вычислений.

Что такое глобальный доступ? Вот простой пример:

Представим, что некий объект попадает в поле нашего внимания. Например, в машине подсвечивается лампа низкого уровня топлива. Почему мы можем ее «осознать», а сама машина — нет? Благодаря существованию у нас сознания этот объект (точнее, его ментальная репрезентация) становится доступным всему нашему организму: мы можем его видеть, вспомнить его, воздействовать на него, говорить о нем. Тогда сознание можно представить как луч прожектора, который освещает определенные объекты и задает направление.

В этом смысле сознание — это фактически синоним внимания (хотя нужно оговориться, что внимание бывает и неосознанным, непроизвольным). Этот процесс позволяет интегрировать множество других процессов, которые происходят неосознанно, чтобы придать организму единый курс для дальнейших действий. По сути, благодаря сознанию становится возможным целенаправленное поведение.

Что такое самоконтроль?

Другое значение слова сознание — рефлексия. Когнитивная система способна контролировать свою собственную работу и получать информацию о себе. Люди много знают о себе, включая такую разнообразную информацию, как расположение собственного тела, происходит ли процесс восприятия или воспоминания, или что они совершили ошибку. Этот процесс соответствует тому, что обычно называется интроспекцией, или тем, что психологи называют метапознанием — способностью понимать и использовать внутренние представления своих собственных знаний и способностей. На интуитивном уровне сознание — это способность дать отчет о своем внутреннем психическом опыте, эдакое внутреннее зеркало.

Эти процессы независимы, то есть глобальный доступ может происходить без самоконтроля, и наоборот. Также многие процессы происходят вообще без их участия, тогда они называются неосознаваемыми или бессознательными.

Алан Тьюринг и Джон фон Нейман, основатели современной информатики, указывали на то, что машины в конечном счете смогут имитировать все возможности человеческого мозга, включая сознание. При этом Алан Тьюринг предположил и оказался прав, что не думающая и не осознающая машина сможет осуществлять сложную обработку информации. Это верно и для людей: когнитивные науки подтвердили, что такие сложные вычисления, как распознавание лиц и речи или оценка шахматной игры, происходят в нашем мозге неосознанно.

И сегодня все современные системы искусственного интеллекта, хоть и впечатляют своими успехами, которые могут превосходить человеческие способности, пока не обладают сознанием.

Тут важно отметить, что два описанных выше процесса не являются общепризнанными в науке как единственно возможные определения сознания. На самом деле психология сознания является, наверное, одной из самых сложных и спорных областей в когнитивных науках.

Как можно наделить сознанием машину?

Так как мы до конца не понимаем, что такое сознание и как именно оно обеспечивается мозгом, на этот вопрос ответить однозначно нельзя. Однако можно наметить направления, следуя которым мы можем получить сознательные машины.

1. Самая простая идея — это скопировать принципы работы человеческого мозга. Одним из примеров является искусственная нейронная сеть. Она начинается как сеть «нейронов», соединенных друг с другом входами и выходами, и совсем ничего не знает — почти как мозг младенца. Способ, которым она «учится», заключается в том, что она пытается выполнить задание — скажем, распознавание рукописного ввода, и сначала действует случайным образом. Затем она получает обратную связь в виде правильного ответа. Связи между нейронами, которые привели к правильному ответу, усиливаются, а к неправильному — ослабляются. После многих проб и обратной связи сеть формирует правильные нейронные пути, и система обучается правильно решать данную задачу. Однако сама по себе искусственная нейронная сеть, хоть и отражает некоторые нейробиологические принципы, не обладает сознанием и не способна решать задачи, которым её никогда не обучали.

Читайте также:  Создан портативный вариант аппарата для УЗИ

2. Второй, более радикальный подход, — это копия всего мозга. Ученые берут настоящий человеческий мозг, различными методами исследуют его нейронные связи, чтобы воспроизвести их на компьютере в виде программы. Если этот метод когда-нибудь будет успешным, у нас будет компьютер, способный на все, на что способен мозг — ему просто нужно будет учиться и собирать информацию.

Насколько мы далеки от достижения эмуляции всего человеческого мозга? Пока что ученые и разработчики смогли смоделировать мозг плоского червя размером 1 мм, который состоит всего из 302 нейронов. Этот проект называется «OpenWorm». Чтобы представить, сколько еще нужно преодолеть, следуя этим путем, вспомним, что человеческий мозг состоит из 86 млрд нейронов, связанных триллионами синапсов.

Если человеческий мозг слишком сложен, чтобы реплицировать его сразу во «взрослом» виде, мы могли бы вместо этого попытаться подражать эволюции. Этот способ использует такое понятие как генетические алгоритмы.

Компьютер начинает выполнять задачи, и самые успешные программы будут «скрещиваться» друг с другом (наследовать друг от друга признаки определенным образом, подробнее тут), а менее успешные будут удалены. При этом в отличие от биологической эволюции, искусственная эволюция имеет два важных преимущества — скорость и целенаправленность. На практике генетические алгоритмы работают не очень хорошо, хотя порой результаты получаются весьма веселыми. До сознания тут, пожалуй, еще тоже далеко.

3. Последний метод самый простой, но, вероятно, самый пугающий. Предлагается создать машину, двумя основными навыками которой будут исследования искусственного интеллекта и внесение изменений в сам код, что позволит ей не только изучать, но и улучшать свою собственную архитектуру. Мы научим компьютеры быть «компьютерными учеными», чтобы они могли сами начать разработку алгоритмов. Возможно, это самый вероятный способ получить сознательную машину в ближайшее время.

Есть ли примеры такого подхода уже сейчас? Близкое понятие — это автоматическое машинное обучение (AutoML), которое успешно внедряют крупные корпорации, например, Google. Идея заключается в том, что автоматизируется сам процесс машинного обучения: алгоритмы сами подбирают наиболее оптимальные алгоритмы для определенной задачи. Сами алгоритмы-подборщики для этого специально обучаются людьми.

Получается, чтобы быть сознательным, необязательно иметь мозг?

Может ли сознание возникнуть в результате других комбинаций и взаимодействия элементов, которых нет в человеческом теле? Если относиться к сознанию, как к функции биологического мозга, то в этой идее нет ничего сверхъестественного. Достаточно создать сложную искусственную систему и поместить ее в достаточно сложную среду, максимально симулирующую реальным мир, в результате чего может возникнуть сознание.

Вернемся к примеру с лампой уровня топлива. Человек замечает, что машину пора заправить, тогда как сама машина этого «не осознает», хоть она и напичкана сложным оборудованием. Индикатор мигает, но все остальные системы автомобиля об этом не догадываются. Машина будет обладать сознанием, если все процессы будут взаимосвязаны, и у автомобиля будет представление самого себя с информацией о своих возможностях и их ограничении. Например, эта «сознательная система» автомобиля будет включать в себя интегрированное изображение себя, в том числе, например, его текущее местоположение и расход топлива, а также его внутренние базы данных (например, «знание», что у него есть карта GPS, которая может определять местонахождение заправочных станций).

Ученые активно работают над созданием общего искусственного интеллекта (AGI). У него будет сознание?

У искусственного интеллекта, как и у сознания, нет общепринятого определения. Например, под искусственным интеллектом понимают процесс обучения машин учиться, действовать и думать, как человек. Цель всего этого — заменить рутинные функции, которые выполняет человек, расширить и усилить его возможности. Иногда выделяют слабый и сильный (или общий) искусственный интеллект.

Под слабым ИИ понимается такая система, которая способна решать задачи, применимые к узкой области. Примеры таких систем — это автоматические языковые переводчики, беспилотные автомобили, умные поисковики. Такие системы могут выполнять задачу (и порой делать это лучше человека), но не могут учиться ничему принципиально новому. Например, известный алгоритм от IBM, обыгравший Гари Каспарова в шахматы, хоть, безусловно, и впечатляет, не может больше делать ничего кроме шахмат. А человек способен еще на многое.

Сильный ИИ может выполнять много независимых и не взаимосвязанных задач. Он способен обучаться выполнять новые задачи и решать новые проблемы. Происходит это путем выучивания новых стратегий. Также предполагается, что он способен «мыслить», обладать «разумом» — совсем как в фантастических фильмах и даже больше.

Так как мы пока толком не можем определить такие сложные понятия как «разум», «мышление», четких критериев появления такой системы у нас нет. Однако появлялись различные идеи, как протестировать систему, чтобы мы могли назвать ее разумной. Пример такого подхода — широко известный тест Тьюринга.

Есть и критика такого подхода — зачем нам создавать системы, которые будут копировать нас самих? Авиаконструкторы ведь не стремятся создать машины, полностью имитирующие голубей, просто потому что голуби умеют летать.

Если у роботов будет сознание, у меня появится перед ними «моральный долг»? Я должен буду их уважать, иначе они будут обижаться и страдать?

На этот вопрос нам, как человечеству, еще предстоит ответить. Но, кажется, что наши этические и юридические нормы будут достаточно сильно пересмотрены в связи с техническим прогрессом. И когда появятся искусственные существа, обладающие разумом и сознанием, наше отношение к ним будет регулироваться и внешними нормами, и нашими собственными эмоциями. Вспомните, что вы чувствуете по отношению к вымышленными небиологическим персонажам книг и кино, как сопереживаете им, расстраиваетесь и радуетесь вместе с ними, хотя они не настоящие. Если верить прогнозам некоторых футурологов, например, Рэю Курцвейлу, то искусственный интеллект, обладающий сознанием, может появиться уже через несколько десятилетий.

Подписывайтесь и читайте нас в Яндекс.Дзене — технологии, инновации, эко-номика, образование и шеринг в одном канале.

В фильме “Главный герой” показали алгоритм любви искусственного интеллекта

В “Главном герое” так и есть. Люди в нем – персонажи компьютерной игры, правдоподобные аватары. Живут они в “Городе свободы” (хороша игра слов на английском – фильм называется Free Guy, а виртуальный город и игра – Free City), который при этом полон агрессии. Убийства, грабежи и расстрелы воспринимаются как нечто само собой разумеющееся. Люди умудряются улыбаться на их фоне и делать вид, что все хорошо. К тому же непристойное поведение добавляет очков жителям компьютерного мира. Но об этом знают не все.

Читайте также:  Использование телефонов перед сном вредит здоровью детей

Очки в фильме есть и в другом смысле – не только баллы. Те, кто носит темные очки и выглядят при этом крутыми, видят нечто большее, чем все остальные. У них – совсем другая система измерений. И именно в ней приветствуется повышенная агрессивность – как способ пробраться на самую верхушку.

Райан Рейнольдс – исполнитель главной роли – прекрасно перевоплотился в компьютерного человечка, который выполняет свою работу клерка в банке. У него есть заурядные привычки и одежда, он пьет одинаковый кофе и даже произносит все время заученно вежливую, но быстро запоминающуюся фразу: “Не хорошего вам дня, а замечательного!”. В нашей сегодняшней реальности, когда некоторые люди действительно похожи на персонажей компьютерных игр, такое актерское перевоплощение не кажется удивительным. Героя Рейнольдса, который просто Парень – без имени, окружают такие же люди-функции. Со своими заурядностями и “крылатыми фразами”. И, казалось бы, все так и будет идти по накатанной – бесконечный компьютерный День сурка, когда вдруг алгоритм Парня – банковского клерка – выходит из-под контроля. Для начала он влюбляется и снимает с другого игрока темные очки, хотя так поступать вроде бы и не должен.

И тут вступает в игру (то есть в сюжет фильма) параллельная реальность – настоящий мир, в котором другой главный герой – талантливый программист Кейз, чью идею (программу, игру, код) украл другой человек и сделал на ней миллионы. Знакомая история, правда? Антагониста – вора идеи, главу компьютерной корпорации по имени Антван – играет Тайка Вайтити. И превосходно исполненная роль делает, по сути, и его главным героем этой картины.

Тут нужно сказать, что фильм “Главный герой” на редкость успешно локализован, то есть и перевод названия, и дубляж сделаны со смыслом и вкусом. Озвучить роль Тайки Вайтити на русском языке пригласили Александра Вартанова – того самого, который уже дублировал персонажа Вайтити в кинохите “Реальные упыри”. Но тут Вартанов подбирает совсем другие интонации, которые коротко можно назвать рэперскими. К тому же привносит в них весь опыт озвучивания компьютерных игр – таковой у него тоже имеется. Все это добавляет характерности в и без того примечательный во всех смыслах персонаж, и каждого появления Вайтити-Антуана зритель ждет, как какую-нибудь пасхалку во время компьютерной игры.

Однако, пора продолжить другое сравнение фильма “Главный герой” с картиной “Я создан для тебя” Марии Шрадер (она вышла в прокат у нас на прошлой неделе). И в той, и в другой картине говорится об особенностях искусственного интеллекта, который в своем развитии заходит гораздо дальше, чем предполагал человек, его запустивший. В “Я создан для тебя” зрителям преподносится история об отношениях женщины с андроидом, который сконструирован с учетом ее вкусов и потребностей. Женщина – ученый, она тестирует опытный образец и приходит к выводу, что взаимоотношения с андроидами рискуют привести к тому, что люди вообще разучатся общаться друг с другом. Конечно, есть же большой соблазн – робот, наделенный искусственным интеллектом, способен подстроиться под партнера, он более удобен, чем человек реальный – в этом-то и засада.

Но есть еще один момент. Искусственный интеллект способен развиваться так, что обычный человек не успевает отслеживать, согласно какому алгоритму тот начинает действовать. Решение этой загадки – и ключевая приманка фильма “Главный герой”. У талантливого программиста с говорящем именем Кейз (в переводе может означать и “ключи”, и “дело”) есть напарница и подруга, которая ему нравится. В реальной жизни ее зовут Милли, в компьютерной игре – Molotovgirl, что дало повод бесконечным шуткам про “коктейль Молотова”. Играет Милли Джоди Комер – исполнительница роли харизматичной и хладнокровной убийцы Вилланель в сериале “Убивая Еву” – за эту работу она получила премию Emmy. Такое имя аватара Molotovgirl, как и последующие шутки, не случайны. Доказательство тому – из-за красивых женщин и любви к ним и случаются все самые важные события – что в истории (яркий пример Елена и Троя), что в компьютерных играх. В игре Free City произойдет революция, и ее катализатором и драйвером станет любовь – и героев, и их создателей. А как следствие исчезнет агрессия среди персонажей игры, ведь выяснится, что очки – те которые баллы – можно набирать и делая добрые дела.

Фильм с незатейливым названием становится “главным героем”, по крайней мере одним из них, среди всех кинолент текущего года. Прежде всего потому, что поднимает темы, которые задевают большинство современных людей, а также из-за способа их отображения. Сейчас редко увидишь картину, в которой компьютерные эффекты – не просто средство создания хорошего аттракциона, но также несут в себе смысловую “нагрузку”, которая приводит к тому, что люди начинают думать. Например, о том, почему в сегодняшние дни им легче вступать в отношения посредством гаджетов, а также о том, какую власть компьютерный мир приобретает над реальным, и к чему в итоге это может привести: кто тогда будет главный герой?

Современное состояние искусственного интеллекта

“Разумные компьютеры становятся безумными!”

“Машины решили, что все человечество должно быть уничтожено или порабощено!”

“Всемогущие роботы стали доминировать над человеческой расой!”

Это то, что мы думаем, когда кто-то произносит “искусственный интеллект”. Особенно в научной фантастике. Мы вспоминаем HAL 9000 из Космической Одиссеи 2001 года, который внезапно решил, что может делать все, что черт возьми он захочет. Терминатор или Альтрон и маниакальные фантазии о расе роботов убийц, одержимых стремлением уничтожить человечество. И не говорите мне о том, что в вашей голове никогда не проскальзывала мысль, что Матрица может быть реальной.

Читайте также:  Создан робот-муравей, способный ориентироваться по компасу

Искусственный интеллект в научной фантастике долгое время был предметом конфликта между человеком и машиной. Во многих отношениях, в этом нет ничего плохого. Люди и машины бок о бок проходили через многие исторические процессы; постоянное напряжение между живым и неживым приводило к взаимовыгодным результатам.

В научной фантастике существует тенденция представлять ИИ в качестве антропоморфных машин. Это один из самых незамысловатых приемов в литературе создать злодея. Дайте машине тело, голос, разум и способность управлять своими действиями. В большинстве случаев, это Макгаффин, раскрывающий наши собственные слабости и недостатки. Мне нравятся подобного плана истории. Я и сам написал их немало. Они служат для того, чтобы помочь нам исследовать нашу собственную природу с точки зрения особенностей, которые делают наш вид уникальным.

Но реже я встречал истории, в которых ИИ предстает тем, чем он является на самом деле… областью исследования компьютерных наук.

В этой статье мы взглянем на фундаментальные принципы искусственного интеллекта, его основные теории и перспективы, чтобы помочь другим авторам понять его истинную природу, потенциал и ограничения.

Идея современного ИИ появилась из ранних работ с компьютерами в 30-х годах. Алан Тьюринг, основатель современных компьютерных вычислительных систем, заявил в основополагающей статье 1950 года, что теоретически возможно построить компьютер способный на мыслительные процессы. Тест Тьюринга стал де факто первым шагом в определении того, достиг ли компьютер уровня ИИ.

Идея теста заключается в том, чтобы проверить способность машины демонстрировать разумное поведение, которое эквивалентно или неотличимо от поведения человека. В общем виде, суть теста состоит в том, чтобы выяснить, сможет ли компьютер в беседе с человеком обмануть собеседника, заставив поверить в то, что он является человеком, а не машиной.

Тест Тьюринга – полезный инструмент для понимания уровня сложности компьютера, но его результаты могут сказать нам только то, что компьютер научился эффективно имитировать поведение человека. В действительности, это ничего не говорит нам о том, думают ли компьютер или обладает определенной степенью сознательности.

Первыми исследователями вычислительных систем, высказавшихся о разумности компьютера в 40-х годах, были – Walter Pitts и Warren McCulloch. Pitts и McCulloch изучали, как функционирует нейронная активность в человеческом мозге и пытались создать цифровую модель, которая позволила бы компьютеру обладать такими человеческими способностями, как зрение, слух и распознавание речи. По сути, они пытались воссоздать человеческий мозг. Они разработали идею “перцептронов”, т. е. концепцию искусственных нейронов, наслоенных таким образом, что вход может быть введен в один конец системы и идентифицирован как выход. Один перцептрон передавал информацию группе других перцептронов и дальше по линии пока возможный выход не будет достигнут.

Системы, по сути алгоритмы, назывались “нейронными сетями”. Начальный прогресс был весьма обнадеживающим. Но работа над нейронными сетями в конечном итоге зашла в тупик в 1960-х годах, к тому же исследователь Марвин Мински усомнился, что реализация модели перцептронов была хоть сколько-нибудь возможна, учитывая технологии, доступные в то время. Марвин Мински утверждал, что модель нейронной сети нуждается в слишком высокой вычислительной мощности и она не решает фундаментальных проблем создания компьютера, который бы обладал здравым смыслом и мог рассуждать на уровне человека.

Более того, Hans Moravec (in “Moravec’s Paradox”) в 1980-х заявил, что

“сравнительно легко заставить компьютеры демонстрировать производительность на уровне взрослого человека в тестах на интеллект и в игре в шашки, но очень трудно или практически невозможно наделить их навыками годовалого ребенка, когда заходит речь о восприятии и мобильности”

По сути, это значит, что относительно легко конструировать компьютеры, которые обладают превосходными логическими способностями (например, умение играть в шахматы), но невероятно сложно создавать компьютеры, которые могли бы демонстрировать человеческую физическую активность и восприятие. Поэтому, исследования ИИ вступили в один из двух периодов так называемого “разочарования”, прозванных в среде ученых “ИИ Зима”. Финансирование иссякло, прогресс замедлился, поэтому фокус внимания переместился на другие области информатики. Первая “ИИ Зима” длилась с 1970-х до середины 1980-х, вторая с 1990-х по примерно 2010-е.

Термин “искусственный интеллект” в наше время считается немного неправильным. Он существует скорее как общее определение для нескольких видов технологий, наделяющих компьютеры и механизмы более интеллектуальными возможностями.

Современный ИИ включает в себя множество разных методов, которые позволяют расширить спектр возможностей компьютера. Например, машинное обучение, глубокое обучение, big data, нейронные сети, когнитивные вычисления и другие. Современный ИИ – это ответ на вопрос “что случится, если предоставить машине бесконечную вычислительную мощность и бесконечные данные?”

Несмотря на то, что нам говорит научная фантастика, ответ на этот вопрос не приводит и не приведет к появлению роботов-повелителей (по крайне мере, не в буквальном смысле). Практическое использование искусственного интеллекта сегодня сводится к упрощению множества задач для различных компаний и организаций. С коммерческой точки зрения, машинное обучение часто используется для решения проблемы персонализации, вроде более таргетированной рекламы или улучшенной рекомендательной системы. В мире существует так много данных, что справиться с таким объемом информации можно только при помощи машин, использующих интеллектуальные алгоритмы, помогающие людям принимать решения.

Но что насчет компьютеров, которые могут видеть, слышать и понимать. Большинство передовых исследований в области искусственного интеллекта выполняются с помощью нейронных сетей. Различные виды нейронных сетей (сверточные нейронные сети, рекуррентные нейронные сети, цепь Маркова, долгая краткосрочная память, генеративно-состязательная сеть и др.) используются такими компаниями, как Google, Microsoft, Facebook, IBM с целью корректной идентификации изображений, речи или текста. К примеру, Microsoft создала микросхемы (программируемая пользователем вентильная матрица – FPGA) с алгоритмами, способными перевести всю Википедию за считанные секунды.

Каждый день вы используете разные виды технологий машинного обучения. Когда вы пользуетесь поисковиком Google (data mining, оптимизация и персонализация) или задаете вопрос Siri на своем IPhone (распознавание речи). Интересные разработки были произведены в области дополненной реальности – наслаивание цифрового контента поверх физического мира. Индустрия движется по направлению к автоматизации, когда компьютеры анализируют данные и на их основе принимают решения за доли секунды, в то время как у человека на подобную деятельность могут уходить недели. То, что мы в данный момент считаем искусственным интеллектом, есть повсюду.

Читайте также:  Создана система, способная фильтровать информацию с первого раза

Но впереди еще долгий путь, даже для решения самых элементарных проблем. Одно из интересных нововведений – это освещение. Facebook использует нейронные сети, чтобы научить компьютеры понимать, как человек двигается на фотографиях и видео, в практике это называют “распознаванием позы”.

Подумайте об этом немного. Нам нужно научить компьютеры понимать, сидит ли в данный момент человек или стоит, машет руками или идет. Это то, на что способен интеллект двухгодовалого ребенка. Несмотря на всю свою мощь и потрясающие способности, основанные на логических вычислениях, машины не настолько умны, особенно что касается познания и восприятия на человеческом уровне. Машины не могут брать на себя ответственность. По крайне мере, не в ближайшее время.

Люди мечтают о Сингулярности, моменте, когда компьютеры обретут сознательность и интеллект уровня человека (или выше) и начнут развиваться и размножаться самостоятельно. То, что произойдет дальше оставлено на ум футуристов, программистов, писателей и сценаристов. Идея разумных компьютеров – глобальная и комплексная, лучше подойдет для другой статьи. Лучше сказать, на данный момент, мы понятия не имеем, как создать разумную машину или даже приблизиться к реализации модели искусственного интеллекта, который можно определить как способность компьютера выполнять любую интеллектуальную задачу, которую может выполнить человек. Всякая научная фантастика, которую вы смотрите или читаете, рассказывает о разумном, сознательном компьютере, обходя проблемы современной компьютерной науки и нейробиологии, чтобы создать живых машин, как будто с помощью какой-нибудь магии. Очень немногие произведения научной фантастики описывают процесс создания ИИ, большинство же просто перескакивают на последствия.

Таким образом, если мы не знаем, как построить сознательный компьютер, возникает более уместный вопрос: “Во что превратится ограниченная функциональность современного ИИ в ближайшие годы?”

Ускорение темпов развития ИИ, как мы теперь понимаем, будет ключом к концу “Информационной” эпохи и началу “Автономной” эпохи. Если грубо обобщить, то “Информационная” эпоха началась с появления печатного станка в 1450 году, который помогал распространять знания и информацию по всему миру. Теперь у нас есть устройства, которые мы носим в кармане и которые могут получить доступ к любому виду данных в течения нескольких секунд или связаться с кем-либо в мире. Это логическое завершение Информационной эпохи.

Следующая эпоха будет той, где наши компьютеры и машины выполняют для нас задачи, основываясь на принципах оптимизации и эффективности, основываясь на огромных объемах данных и эмпирических наблюдениях. Назовите любую форму человеческой деятельности, о которой вы только можете подумать, и вы увидите способ, по которому алгоритмы смогут ее усовершенствовать. И еще, каждая отдельная машина будет ограничена в своих возможностях. Алгоритм, разработанный, например, для сбора урожая не сможет развернуться и выполнить оптимизацию контент-маркетинга. Ближайшее будущее (следующие пятьдесят лет, по крайне мере) будет наполнено множеством узкоспециализированных ИИ, выполняющих конкретные задачи. Создание искусственного интеллекта, который мог бы выполнять множество разнообразных видов задач (что было бы предпосылкой появления искусственного чувства), будет осуществлено уж точно не при нашей жизни.

Автор статьи: Dan Rowinski (technology journalist).

Камера, которая видит человека насквозь

Многие медицинские манипуляции, в частности эндоскопические исследования, представляют собой довольное неприятную и болезненную процедуру. При этом, продолжительность ее, как и общий результат, зависят как от профессионализма врача, так и от наличия необходимого оборудования. Шотландские ученые изобрели прибор, который способен существенно помочь в практике проведения некоторых медицинских исследований и операций. Они придумали камеру, которая видит человека насквозь.

В исследовании говорится, что, прежде всего, данный аппарат был разработан для применения в малоинвазивной хирургии (хирургия, в которой минимизируется область вмешательства в тело человека и используются точечные проколы или естественные физиологические отверстия; основные методы — лапароскопия и эндоскопия).

До настоящего времени при проведении подобных операций, в целях слежения за движением эндоскопического оборудования, использовались дорогостоящие и не всегда абсолютно безвредные методы сканирования, например, рентген. Новая камера способна точно определить местонахождение эндоскопа в теле человека без негативного воздействия и без непосредственного контакта с человеком.

Как работает новая камера

В современных эндоскопах для освещения труднодоступных зон в теле человека, а также для передачи изображения, используется оптическое волокно. Как известно, оно переносит свет посредством внутреннего отражения. Пучок света, который передает волокно, обычно не проходит сквозь тело человека. Большинство фотонов (мельчайшие частица света) рассеиваются или поглощаются внутренними органами человека. Большинство, но не все. В составе света в небольшом количестве присутствуют, так называемые, «нерассеянные» или «баллистические» фотоны. Они движутся преимущественно по прямой траектории (в отличие от обычных частиц) и практически не рассеиваются. «Фишка» новой камеры в ее сверхчувствительности, т.е. она способна улавливать самые мельчайшие частицы света, в том числе, нерассеянные фотоны.

В свою очередь это возможно благодаря использованию однофотонных детекторов, которые размещены на кремниевом чипе камеры. Кроме того, новый прибор способен вычислять и фиксировать время, которое потребовалось для того, чтобы свет прошел от эндоскопа через ткани человека. Все вместе это помогает установить точное местонахождение медицинского оборудования в момент проведения процедуры.

Испытания камеры

Основные испытания прибора проводилось на животных (легкие овец, тушка курицы). Ученые выяснили, что камера без труда регистрирует световой сигнал при толщине тканей около 20 см.

Дополнительное тестирование было проведено на добровольцах. Источник света от эндоскопа располагался за спиной человека, камера — перед человеком. Ученые исследовали время, необходимое прибору, чтобы определить местоположение света. На решение поставленной задачи камере потребовалось всего семнадцать секунд.

Камера, которая видит человека насквозь — это совместная разработка коллектива ученых Эдинбургского государственного университета (Эдинбург, Шотландия) и технического университета Хериота-Уатта (Эдинбург, Шотландия). Это исследование стало частью совместного междисциплинарного сотрудничества, направленного на развитие целого ряда прикладных медицинских технологий.

Участники этого проекта полагают, что новое открытие представляет собой огромную ценность для многих направлений практической медицины.

Читайте также:  Apple перешла на производство козырьков для медицинских работников

Доктор Кев Дхаливал, один из создателей новой камеры

У этого открытия колоссальный потенциал, причем в разных областях применения. Способ, представленный в нашем исследовании — это только один из них.

Как отмечает доктор Михаэль Таннер (Dr Michael Tanner) из университета Хериота-Уатта, самым ценным в работе для него стала возможность сотрудничать с практикующими врачами. «Только так можно понять насущные проблемы практической медицины и использовать существующие в физике технологии для их решения», — рассказывает Михаэль Таннер.

Технологии не стоят на месте и, к счастью, большая часть открытий сегодня приходится на область практической медицины. Так, ранее мы уже писали на coolidea.ru о вечных батарейках для кардиостимулятора, о шприцах, останавливающих кровотечение, а также о технологии, позволяющей назначать лекарства на основании анализа ДНК.

Ваше мнение о бизнес-идее «Камера, которая видит человека насквозь»?

Видеть насквозь. Как изучать предметы, не ломая их?

Почти пять тысяч лет человечество изучало свои изделия, используя только органы чувств: кузнецы прислушивались к звону дамасской стали, архитекторы Великих пирамид наощупь оценивали гладкость блоков. Исследовать рукотворные предметы, не разбирая или ломая их, мы не умели до XIX века, пока не началась история технологий неразрушающего контроля (Nondestrcutive Inspection, NDI).

Началась история неразрушающего контроля, конечно, с разрушения.

В 1854 году на фабрике в Хартфорде (Коннектикут) взорвался абсолютно новый паровой котел. Взрыв разрушил цех и унес 21 жизнь. В эпоху паровых машин котлы лопались нередко, хотя и производились с огромным запасом прочности. О существовании микротрещин и усталости металла инженерам оставалось только смутно догадываться. Взрыв в Хартфорде впервые заставил власти учредить регулярную комиссию, которая должна была инспектировать паровые котлы. Именно тогда инженеры по всему миру задумались о том, как проникнуть внутрь того, что нельзя снять и разобрать.

Последующая научно-техническая революция к середине XX века вооружила нас целым арсеналом методик неразрушающего исследования, призванных предупреждать и предотвращать самые разные беды. Среди таких методик рентген, магнитно-резонансная томография (МРТ), электромагнитное излучение, компьютерная томография и даже космические лучи. О применении этих технологий в медицине, безопасности и на производстве известно много, поэтому мы решили рассказать о самых нетривиальных задачах, которые помогает решать NDI нам и нашим коллегам в других сферах.

1. Как рентген помогает 3D-печати

Если мы можем «просветить» любой предмет, то почему бы не запечатлеть его трёхмерную модель, а затем не сделать его копию? Инженеры Toshiba IT & Control Systems Corporation (ITC) создали максимально точный рентген, который способен поставлять готовые трёхмерные модели в HD-качестве для 3D-печати — аппарат TX Lamino. Он получил название от ламинографии — технологии послойного рентгенологического исследования объектов, которая заложена в его основу.

TX Lamino «просвечивает» предмет с разных углов обзора, что помогает увидеть детали или дефекты, которые невозможно выявить, рассматривая 2D-изображение. Машина оснащена нанофокусным генератором рентгеновского излучения, то есть он может фокусировать лучи в оптической точке диаметром менее 1 мкм, а точнее, в случае TX Lamino, — 0,25 мкм. Это позволяет детально исследовать очень малые предметы. Помогает нанофокусу 4-мегапиксельная камера, которая выдаёт в четыре раза более чёткие изображение, чем у обычных рентгенов с 1-мегапиксельной камерой.

Аппарат TX Lamino. С его помощью можно создать точную 3D-модель любого предмета. Источник: Toshiba ITC

Рентген делает послойные снимки предмета, а затем объединяет их в реалистичную 3D-модель, которую можно посмотреть на мониторе в разрешении 4K. Более того, любой из фотослоев при необходимости можно изучить отдельно от других в 2D. К примеру, на слои можно «разложить» раковину моллюска.

Источник: YouTube-канал Toshiba News and Highlights

Затем модель можно превратить в реальный объект на 3D-принтере, причём его внутреннее строение будет абсолютно идентично оригиналу, даже если речь идёт, скажем, о детали двигателя с подвижными частями. К примеру, с помощью TX Lamino удалось создать полимерную копию шарикового подшипника с вращающимся кольцом.


3D-распечатка детали двигателя, сделанная с помощью TX Lamino. Источник: Toshiba


И тот самый подшипник. Источник: Toshiba ITC


И та самая раковина моллюска. Источник: Toshiba

Технология, позволяющая буквально видеть насквозь любой объект, помогает нам в Toshiba справляться и с менее оригинальными задачами, в частности — с контролем качества. Возьмём, к примеру, автомобили. Любой дефект в важных узлах и механизмах создаёт риск для жизни и здоровья людей. И далеко не все дефекты мы видим невооружённым глазом. Наши промышленные системы, объединяющие рентген и продвинутые технологии визуализации, позволяют выявить эти проблемы.

Любая металлическая болванка кажется на первый взгляд абсолютно цельной. В действительности это не так. В бракованной детали могут быть мириады воздушных пузырей, которые со временем приведут к поломке. Увидеть их можно только «под прицелом» рентгена.


Алюминиевая деталь автомобиля. Слева — рентгеновское изображение, на котором видны скопления воздушных полостей и их размер, дифференцированный по цвету. Справа — 3D-модель. Источник: Toshiba

Впрочем, пока 3D-сканеру не под силу живые существа — морскую раковину или алюминиевую болванку можно просвечивать сколько угодно, а живые организмы, особенно такие, которых нельзя вскрыть, не поломав раз и навсегда, скажем, насекомые, от частого и/или интенсивного облучения портятся.

2. Как спасти жизнь мухи-дрозофилы

У насекомых с технологиями NDI сложные отношения. Получить чёткое трёхмерное изображение мухи почти невозможно: насекомое постоянно двигается, а для качественного снимка нужен полный покой сканируемого. Помимо этого, беспозвоночные с трудом переносят большие дозы облучения, а для хорошего 3D-изображения нужно много снимков, поэтому для насекомых такая фотосессия становится смертельной. Причём даже если фотомодель переживёт съёмки, облучение негативно отразится на её росте, репродукции и продолжительности жизни, что мешает долгосрочным исследованиям.

Наши коллеги из Университета Западного Онтарио в Канаде разрешили эту проблему с помощью углекислого газа. Дело в том, что насекомые обладают способностью выживать при кислородном голодании. Их естественная реакция на недостаток кислорода — это сон, в ходе которого беспозвоночное некоторое время остаётся недвижимым.

С учётом этого был разработан такой метод NDI: фотомодели с удобством размещаются в небольшой камере округлой формы — на подложке из полистирола. Она устанавливается под источником рентгеновского излучения. Затем в камеру с насекомыми подаётся CO2, что вводит их в состояние сна.

Читайте также:  SONY и Microsoft подписали договор о совместной работе

В этот момент начинает работать компьютерный томограф (КТ), подобный тем, что используются для сканирования людей. Главной сложностью на этом этапе была настройкам КТ. Учёные всегда идут на неизбежный компромисс: чем ниже доза облучения, тем хуже качество снимка, и наоборот. Канадские учёные пришли к выводу, что для получения хороших 3D-изображений спящих насекомых достаточно излучения, которое в 80 раз слабее того, что приводит к их стерилизации. Как оказалось, взрослые мухи, колорадские жуки, гусеницы вполне справились с 7-часовым стресс-тестом на гипоксию и облучение, после чего быстро пришли в себя.


Трёхмерная компьютерная томография (разрешение — 20 микрон) самца мотылька. Слева — первая фотосессия, справа — через четыре дня. Он жив, хоть и устал. Источник: BioMed Central Ltd

Впрочем, абсолютный покой не всегда гарантирует успех NDI, особенно если нас интересует не строение предмета исследования, а, к примеру, надписи в нём.

3. Как с помощью NDI читать книги

Возможно, скоро сбудется мечта всех студентов — получать информацию из закрытой книги без всякого ясновидения. Для этого группа учёных из MIT призвала на помощь вполне реальные силы электромагнетизма и терагерцевое излучение (среднее между инфракрасным и микроволновым). Терагерцевые волны хорошо известны специалистам по безопасности: различные химические вещества по-разному поглощают определённые частоты ТГ-излучения.

При прохождении ТГ-лучей через чернила и чистую бумагу, сенсорный приёмник получает различный отпечаток интенсивности — вот способ читать книги или свитки, не разворачивая их, — очень полезно, когда листы слиплись и/или стали очень хрупкими, что часто бывает со старинными изданиями, к которым необходим доступ исследователей. Процесс организован так: ТГ-излучатель генерирует ультракороткие импульсы излучения на книгу, а встроенный датчик камеры считывает их отражение от крошечных воздушных карманов шириной 20 мкм, которые есть между страницами книги. Отклик от букв и пустых страниц выглядит по-разному, позволяя различить надпись.

Источник: YouTube-канал MIT Media Lab

Но не всё так просто. Большая часть излучения либо отражается, либо поглощается книгой, а другие частицы отскакивают не от воздушных пузырей, а от других страниц, создавая ложный сигнал. Чтобы отделить ложные сигналы от истинных, нужно знать расстояние от приёмника до конкретной страницы книги. Сейчас разработанный учёными алгоритм теоретически может различить написанное на глубине до 20 страниц. Но на практике примерно на глубине девяти страниц энергия отражённого сигнала становится настолько малой, что отличить её от шума уже невозможно. Так что пока мы можем читать, скорее, газеты, а не книги, хотя исследования продолжаются. К тому же, для NDI есть задачи и из эпохи дописьменной истории.

4. Играл ли неандерталец на флейте?

Помимо медицинских вопросов, изобретение Вильгельма Рентгена помогает решить исторические задачи. Например: могли ли неандертальцы играть на флейте?

Задуматься учёных заставила найденная в пещере Дивье Бабе (Словения) кость пещерного медведя. В ней проделаны два отверстия, а на местах сломов видны очертания ещё двух. Вместе они образуют ряд, как на флейте. Возраст находки — 43 тыс. лет поэтому одни учёные считают, что мы нашли изделие неандертальцев, а другие видят в косточке объедок пиршества гиен, чьи клыки могли проделать такие аккуратные отверстия.


«Неандертальская флейта» из Дивье Бабье. Автор отверстий — либо неандерталец, либо пещерная гиена. Источник: Sporti / Wikimedia Commons

Чтобы досконально рассмотреть «флейту», учёные применили компьютерную томографию (КТ): рентген просветил кость с разных углов, а компьютер объединил снимки в трёхмерное изображение. Выяснилось, что на кости действительно много следов поедания животными, но далеко не все можно однозначно отнести к воздействию челюстей. Затем с помощью полученных снимков учёные реконструировали копию «флейты».

Как выяснилось, на ней действительно можно играть: инструмент выдаёт до 2,5 октав в последовательности мелодий по 12-тональной шкале. «Неандертальской флейте» под силу легато, стаккато, фруллато, глиссандо и другие приёмы исполнения.

Небольшую флейту просветить рентгеном не так сложно, но есть исторические памятники побольше. Гораздо больше. Как быть с ними?

5. С небес на землю: как космические лучи помогли сделать «рентген» пирамиды

Почти все наши всевидящие технологии остаются «близорукими»: «зрение» радиолокаторов, рентгеновских установок, ультразвука не простирается дальше (глубже) нескольких метров. А надо больше! Примерно с такими мыслями в 2016 году группа японских учёных из Университета Нагои смотрела на пирамиду Хеопса объёмом 2,5 млн кубометров. Они решили отсканировать этот объект космическими лучами, которые рождаются источниками высоких энергий, скажем, взрывами сверхновых. Проходя через атмосферу Земли, космические лучи превращаются во вторичные частицы — мюоны. У них очень высокая проникающая способность: преодолеть даже 1 километр известняковых блоков для них не проблема.

Материя поглощает больше мюонов, чем пустота. Чтобы «поймать» частицы японцы поставили специальные ловушки внутри известных камер пирамиды. Яркие мюонные отпечатки указали на ранее неизвестную полость над Большой галереей пирамиды Хеопса. Пространство длиной 30 метров напоминает по форме Большую галерею. Как предполагают египтологи, космические лучи помогли обнаружить техническое помещение — полость снижает давление блоков на своды Большой галереи.

Кстати, такую же технологию сейчас применяют российские учёные в Дербенте: они пытаются понять, было ли крестообразное строение, полностью скрытое под землёй, древнейшим христианским храмом в России или всего лишь водохранилищем.

Что будет дальше?

Мы полагаем, что в ближайшем будущем технологии неразрушающего контроля будут объединены с другими передовыми разработками:

  • Big Data поможет нам собирать и интерпретировать намного больше информации, чем способен абсорбировать живой рентгенолог;
  • нейросети позволят сделать NDI более проактивным: мы сможем построить систему массового тестирования изделий, деталей, узлов ещё на стадии производства, не требующую непосредственной оценки человека;
  • непосредственный результат этих операций будет внедряться автоматически с помощью 3D-печати. Обработанные результаты анализа послужат «пищей» для 3D-принтеров, которые немедленно устранят недостатки или усовершенствуют изделие в конвейерном режиме.
Ссылка на основную публикацию