software-development
April 27

Про искусственный интеллект

Популярно с картинками для детей, инвалидов и высшего командного состава.

Поколение Хэ

Вы даже не представляете как меня за#бали этими AI.

Шиза настолько массовая, что все #банулись кто не рассказывает как меня и мою работу скоро заменят искусственным интеллектом, те просят этот самый AI для них написать.

Просят и взрослые (вроде бы) люди, сдавшие не один проект и совсем зеленые дети. Как с профильным образованием и опытом работы в ИТ так и абсолютно ничего не понимающие в компьютерах.

Дошло до того, что уже на государственном уровне пошли программы цифровизации и внедрения искусственного интеллекта.

При этом что же такое «искусственный интеллект» никто не понимает даже в среде ученых, которые непосредственно занимаются изысканиями в этой области.

Вообще тема AI — очень хорошая лакмусовая бумажка, которая как совсем недавно термин «блокчейн» четко отделяет п#здоболов от специалистов.

Реальных специалистов по AI в мире единицы и нанять вы их не сможете, при всем желании.

Хотя конечно моим словам вы не поверите:

вакансии на HH висят? Висят. Значит и специалисты есть.

Чугуниевая логика.

Чугуниевые цифры

Посмотрите вот на это:

1500

Это не поверите — цифры, обозначающие сумму «тысяча пятьсот».

Цифры образующие сумму «тысяча пятьсот» не нарисованы на картинке, а введены в редакторе страницы блога в виде цифр.

Если бы эта сумма вводилась в бухгалтерской программе, то ее ввод осуществлялся бы в специальное поле с числовым типом, затем введенное значение было бы сохранено в базе данных, также в поле с числовым типом и все расчеты с этой суммой также бы производились с четким осознанием что это именно число.

Сумма в виде набора цифр для компьютера является однозначной сущностью.

Нет и не может быть разных «толкований» того что такое число, нет никакой неоднозначности для компьютера — 1500 это всегда 1500, оно вводится как 1500, отображается как 1500 и хранится как 1500.

Теперь берем однозначную сумму 1500, умножаем ее на 3 и получаем не менее однозначный результат: 4500.

Действие умножения — однозначно, не имеет других толкований и других смыслов, результат операции проверяем и верифицируем с помощью самой банальной школьной алгебры и текстового блокнота с ручкой.

В этом и есть суть компьютеров:

в однозначности выполняемых операций.

Ради этого их придумали и ради этого используют.

Теперь, зная все это давайте разбираться что же такое «искусственный интеллект», вернее что именно нам предлагают под этим термином.

Правда похоже получилось?

Если «Ж» то жопа, если клюв то гусь

Посмотрите на картинку выше — это идеальная иллюстрация сути AI, как оно работает и почему.

Эта картинка — не очень удачный результат работы нейросети, которая генерирует изображения по заранее известному эталону.

В данном случае это стилизация под китайские порномультики аниме, но только нейросеть решила что два китайских лица (одно над другим) на темном фоне имеют что-то похожее с анимешной девочкой стоящей к зрителю жопой.

И с точки зрения технологии нейросеть очень даже права, поскольку материал на котором ее обучали видимо содержал много сцен с персонажами в такой позе (стоящих спиной).

В этом и кроется фундаментальная проблема AI — в неоднозначности входящих эталонных данных.

Ради того чтобы например умная колонка «Алиса» могла с вами «общаться», ее создатели собрали сотни миллионов записей диалогов реальных людей, которые им пришлось оцифровать, разметить и использовать для обучения нейросети.

Как думаете что случится если дать команду Алисе произнося слова в обратном порядке? Или поиграть с темпом — от скороговорки до мееееедленного растягивания слов?

Случится облом.

Потому что на разном тембре произношения ломаются абсолютно все голосовые системы — как раз из-за невозможности соотнести эталонные данные, на которых систему обучали и тем что вы ей наговорили на бегу.

Но вернемся к моим любимым цифрам.

Как думаете, что произойдет если мы попробуем ввести в компьютер нашу замечательную сумму 1500, но вместо клацания по кнопкам на клавиатуре для ввода цифр в «устаревшие формы», мы например произнесем ее голосом или напишем ручкой на бумаге и попробуем скормить «искусственному интеллекту»?

Думаю вы уже догадываетесь — все будет далеко не так просто и однозначно как с клавиатурой:

  • Тысяча пятьсот
  • Тттыыща.. (пауза в несколько секунд) пицот
  • Тща и еще пецот
  • Полтора

..

Таких вариантов еще много, разных, с разными акцентами, но самое главное — с разным контекстом разговора, ведь речь далеко не всегда может идти про деньги.

Как же помочь машине понимать контекст?

Правильно — еще одной тренировкой на специально подготовленных данных, но уже для определения смысла беседы.

И вот на ровном месте, просто для самой простой разметки и самого простого ввода набора цифр с помощью искусственного интеллекта вам нужно две разных модели — одну для определения самих цифр, другую для определения контекста.

Теперь давайте расскажу про рукописный ввод.

Допустим вы невероятно круты в письме, не забросили это дело после окончания школы и до сих пор используете ручку не только для подписи документов — редкий дар в нынешнее электронное время.

Ваш почерк при написании цифр где-то на уровне примера выше — т. е. очень и очень хороший для современного человека, цифры хорошо различимы и не имеют сильной разницы по высоте (не скачут).

Так вот даже в этом невероятно удачном случае распознается где-то 80-90% при вводе одних только цифр.

А ведь чаще всего цифры идут в составе текста — предложения или таблицы, что тоже является контекстом.

Как может быть распознана сумма 1500:

  • l500
  • 15OO
  • i50O

Это все реальные варианты и разработчики обычно пишут специальную постобработку, которая докручивает распознанное значение после AI используя примитивные паттерны и подстановку.

Как и почему может быть столько вариантов для казалось бы простой суммы 1500 нарисованой ручкой на бумаге?

Наклон, излом, разная толщина линий, половая ориентация автора.

Правда весело?

Наклонил текст, цифры распознались немного не так и вместо 50 долларов выписали штраф на $5000 — между прочим реальная история.

Теперь поговорим о логике.

Электронный бро

Л — Лгоика

«Алиса! Будь добра — посчитай зарплату воон тому долбо#бу» — о чем-то таком мечтают все те интересные личности, пытающиеся увязать бухгалтерские системы с AI.

Что в этом случае делать бедному роботу?

Объясняю по шагам:

  1. Найти «этого долбо#ба» из контекста беседы;
  2. Определить смысл командной фразу «посчитай зарплату», также исходя из контекста и на основе предыдущего обучения по эталонным данным;
  3. Провести операцию и доложить пользователю.

Именно так и работают голосовые помощники.

Круто и высокотехнологично?

Наверное, но лично мне такое нах#й не надо, как и ни одному нормальному бухгалтеру. Потому что увольнение это внезапно сложно.

Это цепочка связанных действий, одно из которых это физическая выдача на руки «документа ответственного хранения» — трудовой книжки увольняемого сотрудника.

Любая ошибка в этом процессе приводит к штрафам для компании, часто большим.

Да кстати, вы ведь тоже заметили что фраза «посчитай зарплату» не обязательно означает немедленное увольнение да? Это может быть и просто сбор статистики по зарплате сотрудника за период — чтобы увидеть цифру с учетом всех налогов и затрат.

Но робот, если нет уточнений и контекст непонятен — принимает решение на основе наиболее часто используемого смысла, также как и современные поисковые системы.

Поэтому возьмет и уволит к х#ям вашего лучшего сотрудника — просто потому что кожаные мешки должны страдать ему такой вариант подошел больше.

Эпилог

Понимаю что все это возможно несколько натянуто и звучит как отговорки, но представьте на секунду, что обсуждаемая сумма 1500 это ваша собственная зарплата.

Или может это какой-то важный показатель вашего здоровья или пробег двигателя на машине — что-то важное, от чего может зависеть ваша жизнь.

Вы точно доверите это «искусственному интеллекту», с учетом всего описанного в статье?