В декабре 2023 года «Яндекс» запустил новый сервис аналитики «Нейростат», по данным которого, интерес к нейросетям вырос за год в 15 раз. Такой рост обусловлен не только потрясающими возможностями искусственного интеллекта и простым человеческим любопытством. Нейросети все сильнее вплетаются в нашу повсеместную рабочую деятельность, становясь как незаменимым помощником для тысяч специалистов из разных отраслей, так и предметом жарких споров сторонников и противников искусственного разума.

31 декабря 2023
Иван Мишин
Игорь Бахарев

Игра в «крокодила»

Любая нейросеть представляет собой сложную математическую модель. Приставка «нейро-» подсказывает, что в ней имитируется работа человеческого мозга: вычислительные элементы (процессоры) передают сигналы аналогично нейронам, из которых состоит центральная нервная система человека. При этом искусственные нейроны в сети связаны друг с другом не в хаотичном порядке, а структурированы в слои. Основной принцип работы сети заключается в ее обучении (пополнении данными) путем настройки связей между нейронами. Чем больше слоев и чем корректнее прописаны закономерности перехода между ними, тем лучше обучается нейросеть. 

Концепция нейросетей возникла на заре изучения искусственного интеллекта. В 1943 году американские ученые Уоррен Мак-Каллок и Уолтер Питтс представили нейрон как логический элемент, который при обработке данных может принимать только два состояния. Если информация незначительная или не соответствует действительности, то нейрон на выходе дает 0, а если входные сигналы имеют весомую важность, то 1. 

Отдаленно все это напоминает игру «крокодил», когда мы пытаемся отгадать, что нам показывают с помощью мимики и жестов. Во время игры мы сопоставляем между собой входящие сигналы и неправильные ответы, стремясь снизить риск ошибки. То же самое делает и нейросеть, благодаря так называемому алгоритму обратного распространения ошибки, разработанному в 1986 году Дэвидом Румельхартом, Джеффри Хинтоном и Рональдом Уильямсом. И хотя возможности компьютерной техники тогда были весьма ограниченны, да и действительно больших объемов данных для обучения нейросетей еще не имелось, появление алгоритма дало импульс развитию исследований в сфере машинного обучения. 

Дальнейшему развитию нейросетей в значительной степени способствовала сфера развлечений и компьютерные игры. С начала 2000-х годов их «движки» стали требовать обработки все большего числа операций, что привело к появлению видеокарт, которые имеют тысячи относительно простых вычислительных ядер на одном чипе. Это оптимально подходило для архитектуры нейронной сети, которая, по сути, представляет собой систему взаимодействующих  простых процессоров. 

Первыми, кто решился использовать видеокарты для обучения искусственного интеллекта, стали исследователи из университета Торонто. В 2012 году они представили миру нейросеть под названием SuperVision. Ранее ни одна нейронная сеть не могла превзойти классические алгоритмы машинного зрения при распознавании изображений, но канадской разработке это удалось.

В этом же году канадец Ян Гудфеллоу из Монреальского университета создал программу, которая успешно генерировала реалистичные изображения. Он также придумал название для нового вида нейросетей – генеративно-состязательная сеть (GAN). И спустя 11 лет, в 2023 году, именно GAN-сети, самой известной из которых является ChatGPT, начали свое победоносное шествие по планете. 

Умная экономика

Развитие линейки графических процессоров открыло дорогу «глубокому обучению» (Deep Learning). Его суть – в увеличении числа искусственных нейронов в слоях нейросети, что ускорило обработку входящей информации и в разы снизило ошибки на выходе. В результате уже через два года после создания SuperVision появилась сеть GoogLeNet. И если разработка из университета Торонто имела всего пять слоев и ошибалась при распознавании объектов в 16,4% случаев, то нейросеть от компании Google состояла уже из 22 слоев, что сократило количество ошибок до 6,7%. Почти как у человека – он дает неверные ответы примерно в 5% случаев!

Слоистые нейронные сети – нейронные сети, в которых нейроны разбиты на отдельные группы (слои) так, что обработка информации осуществляется послойно. Слой – один или несколько нейронов, на входы которых подается один и тот же общий сигнал.

Современные нейросети имеют сотни слоев, что позволяет им обучаться самостоятельно, без внешней настройки. Да и ошибаются они уже реже, чем человек. Разумеется, это подогревает глубокий интерес к нейросетям со стороны бизнеса. Так, еще в начале 2010-х годов в деловых стратегиях крупнейших компаний (прежде всего в сфере IT и телекоммуникаций) появилось понятие Big Data. В нейронные сети как перспективный инструмент обработки больших данных стали вкладывать не менее большие деньги. 

Только в 2022 году мировой рынок генеративного искусственного интеллекта принес 40 млрд долларов. А аналитики информационного агентства Bloomberg Intelligence прогнозируют, что через 10 лет доходы рынка нейросетей могут увеличиться до огромной суммы – 1,3 трлн долларов. 

Россия не отстает от глобального тренда. По данным Национального центра развития искусственного интеллекта при правительстве РФ, примерно 53% крупных компаний применяют ИИ в своей деятельности. Чаще всего нейросети использует крупный бизнес, у которого есть бюджет на их разработку и запрос на обработку больших массивов данных. Искусственный интеллект помогает определить кредитоспособность клиентов финансовых организаций, диагностировать заболевания, создавать персонализированные рекомендации в маркетплейсах и оптимизировать поисковые запросы под предпочтения пользователя. А в последнее время нейросети все чаще применяются в сфере образования.

«Это становится мировым трендом. Уже сегодня ряд компаний применяет и развивает образовательные решения на базе ИИ, причем использование нейросетей не ограничивается каким-то одним направлением. Даже простейшая нейросеть может генерировать задания для учащихся. А вот для автопроверки выполненных заданий, как правило, используют большие языковые трансформеры (например, ChatGPT). Обучать этому свою нейросеть сложно и долго, поэтому проще взять готовое решение», – отмечает аналитик компании MAXIMUM Education Руслан Кондрашук. 

Попали в нейросети

На сегодняшний день самым популярным в мире решением на основе нейросетей является чат-бот ChatGPT. Приведем несколько цифр. В феврале 2023 года этот сервис побил исторический рекорд по росту посетителей – всего за один месяц его аудитория увеличилась на 100 млн активных пользователей. Такая популярность заключается в широких возможностях нейросети GPT, к которой обращается чат-бот. Она умеет писать код, создавать тексты, переводить на другие языки, обращаться к контексту диалога для ответов. 

Впрочем, как показал опрос платформы GeekBrains, почти половине пользователей нейронные сети нужны для трех вещей: поиска информации, написания текстов, создания изображений. Это объясняет, почему ChatGPT остается самым востребованным решением и в нашей стране. Следом за ним идет еще одна зарубежная разработка, Midjourney, которая как раз генерирует картинки по текстовым описаниям. 

На волне успеха популярных западных сервисов стали появляться и российские разработки. Так, YandexGPT и GigaChat стали нашим ответом ChatGPT, а «Шедеврум» и Kandinsky – Midjourney. Отечественные нейросети пока уступают зарубежным аналогам, поскольку их разработка стартовала позже. Но уже сейчас у решений из России есть очевидные преимущества. 

«Плюсы российских разработок в том, что они обучаются на русскоязычных текстах и за счет этого смогут в дальнейшем выигрывать у своих зарубежных конкурентов. Тот же ChatGPT сейчас переводит все запросы с языка пользователя на английский и, соответственно, в обратной последовательности дает ответы. При переводе многое теряется, и в этом смысле у нейросетей, обучающихся на родном языке, появляется окно возможностей», – говорит Руслан Кондрашук. 

Достоинства разработок из России видит и Ольга Ринк, заместитель руководителя научной группы «Машинное обучение и семантический анализ» Института искусственного интеллекта МГУ.  По ее мнению, отечественные модели уже прекрасно рисуют по пользовательским запросам, а чат-боты российских банков вполне справляются с решением финансовых вопросов клиентов, хотя на общие темы иногда дают не очень корректные ответы.

С усилением санкционного давления на нашу страну отечественные решения на базе нейросетей стали смотреться еще более выигрышно. Так, разработчик GhatGPT заблокировал пользователям из России доступ к своим сервисам, а подписку на Midjourney невозможно оплатить российскими картами. Конечно, при желании можно пойти обходными путями, как делают некоторые компании, продолжая использовать корпоративную версию ChatGPT. Однако очевидно, что юзабилити зарубежных сервисов для россиян серьезно пострадало из-за санкций. 

Киберпанковое будущее

Не так давно нейросети казались чем-то из области научной фантастики, а теперь они уже вступили в конкуренцию с человеком в некоторых сферах деятельности. На их стороне – скорость выполнения задач, персонализация под конкретного пользователи и гибкость в настройке под определенную цель за счет возможностей глубокого обучения. 

«Нейросети являются одновременно и помощником, и заменой человеку. Это – не дихотомия, не противопоставление, а сочетание того и другого варианта. В будущем будут нужны все более сильные специалисты, потому что для работы с нейросетью требуются хорошее образование и понимание, как функционируют большие языковые модели, как с ними необходимо общаться и как лучше всего их использовать», – считает Руслан Кондрашук.

По его мнению, широкое внедрение нейросетей в экономику не затронет высококвалифицированных и низкоквалифицированных специалистов, а вот по средней прослойке может сильно ударить. С другой стороны, развитие искусственного интеллекта создает новые рабочие места. Уже сегодня на HR-порталах можно найти вакансии промпт-инженера – человека, который умеет общаться с нейросетями и корректирует выдачу информации по пользовательским запросам. При этом, по оценке директора Национального центра развития искусственного интеллекта при правительстве РФ (НЦРИИ) Сергея Наквасина, кадровая потребность российского рынка уже сегодня составляет порядка 40 тысяч специалистов в области искусственного интеллекта, поэтому значительная часть новых профессий будет формироваться в области разработки и поддержки ИИ-технологий.

Впрочем, современные нейросети еще далеки от идеала и полностью им доверяться было бы неблагоразумно. Предугадать ответ нейронной сети нельзя. К тому же искусственный разум гораздо чаще человеческого испытывает «галлюцинации» или «бред». Так на IT-сленге называют ситуации, когда нейросеть выдает либо бессвязную несуразицу, либо ответы, не имеющие никакого отношения к запросу. Не говоря уже о том, что в примерах для обучения нейросети могут быть ошибки – случайные или намеренные.

Другая проблема применения ИИ связанна с «бритвой Оккама» –философским принципом, в кратком виде гласящим, что «не следует привлекать новые сущности без крайней на то необходимости». Нейросети далеко не везде уместны. Конечно, их помощь нужна там, где нужно решать задачи поиска, идентификации, моделирования при огромных и постоянно обновляющихся объемах данных. Но есть сферы, где заменять человека как минимум неэтично, как максимум – опасно. И нельзя обходить вниманием такой момент, как использование ИИ в преступных целях.

Все это актуализирует вопрос о законодательном регулировании развития и применения ИИ. В России работа в данном направлении ведется с 2019 года, когда была утверждена Национальная стратегия развития искусственного интеллекта на срок до 2030 года. Два года спустя появился Кодекс этики ИИ, к которому на сегодня присоединилось более 160 организаций из различных регионов России. Продолжается построение национальной системы стандартизации в сфере ИИ – принято уже более 40 ГОСТов. Ведется разработка федерального закона об искусственном интеллекте, который, по словам заместителя главы Минцифры РФ Александра Шойтова, охватит такие направления, как обезличивание данных и масштабирование уже имеющихся «правильных решений».

«Национальные институты обсуждают этические вопросы политики, обеспечивающей безопасность развития ИИ, которая должна включать требования прозрачности в отношении частных разработчиков, адекватные системы оценки, инструменты тестирования степени опасности, задействование возможностей государственного сектора экономики и проведения научных исследований», – подчеркивает Ольга Ринк. Эксперт напоминает, что одним из первых шагов в этом направлении на международном уровне стала «Декларация Блетчли» – документ по безопасности использования ИИ, который подписали 28 стран, включая США, Канаду, Китай, Индию, ФРГ, Францию и др. 

Ну а что же по поводу регулирования думают сами нейросети? «Регулирование может быть полезным для обеспечения безопасности, защиты прав граждан и предотвращения возможных негативных последствий использования искусственного интеллекта. Например, важно установить правила и нормы в отношении обработки и защиты персональных данных, а также урегулировать вопросы ответственности за ошибки или злоупотребления в использовании ИИ. С другой стороны, излишнее или непродуманное законодательство может ограничить инновации и развитие искусственного интеллекта, поскольку оно может создавать лишние бюрократические препятствия и усложнять процесс разработки и внедрения новых технологий», – считает нейросетевая модель GigaChat.

Как видим, законодательное регулирование развития и применения искусственного интеллекта необходимо, но должно быть основано на тщательном анализе и консультациях с экспертами в данной области. При этом важно найти баланс между регулированием и стимулированием развития искусственного интеллекта.

Как они работают

Работа любой нейросети включают в себя три этапа: сбор данных, обработку данных и принятие решений на основе данных. Основные задачи, которые решают современные нейросети, можно разделить также на три вида: классификация, предсказание и распознавание. 

Классификация. На основе заложенных данных нейросеть определяет, к какому типу относится тот или иной продукт. Например, она может указать жанр художественного произведения, степень полезности продуктов питания, диагностировать заболевание и т. д. В банках нейросети могут анализировать не только структурированные данные, такие как информация о транзакциях, но и неструктурированные: текстовые сообщения, электронную почту, записи телефонных разговоров. Используя методы обработки естественного языка (Natural Language Processing, NLP) и компьютерного зрения (Computer Vision, CV), ИИ выявляет и анализирует подозрительные сообщения или изображения, связанные с мошеннической деятельностью.

Распознавание. Прежде чем отнести какое-либо явление к той или иной группе, ИИ должен распознать его на основе данных, которые алгоритм получил в процессе обучения. У многих на слуху одна из возможных функций ИИ – распознавание лиц. Эта программа лежит в основе биометрической идентификации и работает с введенными в нейросеть данными людей. Так, биометрическая платформа Банка России используется для распознавания прибывающих из других банков инкассаторов, отслеживает права доступа сотрудников не только в те или иные охраняемые помещения, но и в определенные программы с компьютеров организации. При этом распознать нейросеть может не только человека по внешнему виду, но и мошенника по его поведению. 

Предсказание. Удачное распознавание стимула и его классификация позволяют алгоритму предсказать, что будет дальше. Опять же на примере банковской деятельности: если нейросеть обнаруживает необычную или подозрительную активность, она может сигнализировать о возможном мошенничестве, что позволяет банку принять соответствующие меры еще до того, как что-то случилось. Таким образом, ИИ автоматизирует процесс обнаружения мошеннической активности и снижает необходимость вручную проверять огромные объемы данных. Постоянное обновление и самообучение нейросетей позволяет банкам быть в курсе последних мошеннических схем и изменений в активности преступников, а также адаптироваться к новым выявленным угрозам.

теги:
Поделиться:
Напишите что-нибудь и нажмите Enter