Технорассылка

ИИ на человеческом топливе, замена кредитного рейтинга и страшный «Инопланетянин»

5 ноября 2018

Редакция The Bell

Прорывы в области машинного обучения создают опасную иллюзию, будто люди в процессе не участвуют. На деле каждый алгоритм требует хорошего набора данных — правильно размеченного, структурированного и сбалансированного. К сожалению, предоставить такие наборы в состоянии только люди — они как бы продают собственные суждения о тех или иных вещах.

Тема выпуска — искусственный интеллект человеческими руками.

Поставщики больших данных разной степени структурированности в 2018 году выручат $65 млрд, говорится в отчете The Big Data Market: 2018–2030. К концу 2021 года рынок вырастет до $96 млрд. Пресс-релиз не отмечает этого, но одними из бенефициаров станут развивающиеся страны, где потребность крупных компаний в разметке наборов данных создаст десятки тысяч рабочих мест.

Один из центров разметки данных наряду с Индией и Филиппинами — Кения, где тысячи низкооплачиваемых работников ежедневно объясняют компьютеру, где на фотографии находятся витрины, дороги, светофоры и автомобили.

Тем же изредка занимаются миллионы пользователей Сети, когда разгадывают капчу от Google, задаваясь важнейшим вопросом современности — является ли ножка дорожного знака дорожным знаком.

Предполагается, что это самый простой способ дать прожорливым алгоритмам беспилотных автомобилей достаточно данных (другой способ использует Tesla, собирая данные поездок со всего флота собственных автомобилей).

Центры сбора и обработки информации есть у каждой уважающей себя крупной технокомпании. Amazon для классификации товаров создал систему раздачи мелких задач Mechanical Turk. Это дало возможность не только структурировать данные для машинного обучения, но и избежать применения ИИ. Один французский стартап за небольшую сумму (около €10 в месяц) оцифровывает ваши чеки, внося их в базу данных. Никакого искусственного интеллекта там нет, все данные вносят рабочие Mechanical Turk за считаные евроценты.

У российского «Яндекса» тоже есть свой «Турок», сервис Яндекс.Толока. Это персональная армия подрядчиков, фильтрующих нежелательный контент, собирающих чеки в магазинах, фотографирующих магазины, определяющих наличие рекламы на страницах и делающих все, что пока не научились машины.

Что мне с этого? Карьерные и управленческие возможности. Искусственный интеллект похож на подростка, который может разложить фотографии на хорошие и не очень, но неспособен назвать стилистические различия «Офелии» прерафаэлита Милле и «Аленушки» Васнецова.

Дешевая рабочая сила призвана решать простые задачи по грубой структуризации, но пасует перед сложными. Недавние прорывы в области машинной диагностики диабетической ретинопатии произошли благодаря усилиям высокопрофессиональных офтальмологов, отвечающих за свои оценки собственным опытом. То же касается геологоразведки, фармацевтики и многих других сложных отраслей.

Спрос на специалистов, которые могут выносить более ценные суждения, растет. Будет расширяться и спектр требуемых суждений — структура полученных оценок не обязательно охватывает нужные параметры. Люди, которые до обучения нейросети могут составить правильную модель, уже сейчас на вес золота.

У кредитного рейтинга появилась замена

Повальное структурирование и обработка информации помогли корпорациям разработать собственные метрики, показывающие, сколько тот или иной потребитель принесет денег за всю свою жизнь (они так и называются — customer lifetime value).

В отличие от кредитного, такие рейтинги нельзя где-то запросить или подсмотреть, но они влияют на его отношения с компанией. Низкий рейтинг может привести к долгому ожиданию на линии, завышенным ценам на сервисы и поддержку.

Данные о пользователе собираются из сотен источников, а не только истории покупок, и иногда компания решает, что на этого человека просто не стоит тратить время.

Что мне с этого? Индивидуальные расчеты стоимости клиента активно применяются и в России. Сотовый оператор и банк почти наверняка считают, что знают о вашем будущем больше вас. Точно то же самое с сетями фастфуда, которые собирают данные через приложения и скидочные программы.

Саудовские техномиллиарды никуда не исчезли

Японская корпорация SoftBank объявила о квартальной прибыли в $6,2 млрд. Существенная часть этих денег пришла от венчурного технофонда Vision Fund объемом в $100 млрд.

Vision Fund создан при участии саудовских инвесторов, к которым после убийства журналиста Джамаля Хашкаджи оказалось приковано пристальное внимание владельцев западных компаний. Все они решают — токсичны ли деловые отношения с Саудовской Аравией и вредят ли они бизнесу.

Основатель SoftBank Масаёси Сон заявил, что потребовал от саудовских властей найти и наказать виновного. Тем не менее он подчеркнул, что арабские деньги останутся в фонде. И Softbank такой не один — американские банки уже решили, что не будут отказываться от работы с Саудовской Аравией, а основатели стартапов, получивших саудовские деньги (например, Илон Маск), оправдывают страну как могут. Это может спровоцировать крупный конфликт в неожиданном месте.

Сотрудники технокомпаний обычно подчеркнуто не интересуются политикой. Но убийство заставило их сомневаться в этичности работы на компании, куда инвестировали саудовские принцы. Даже если топ-менеджмент смирится с этими деньгами, низовое движение может пресечь отношения с Саудовской Аравией.

Что мне с этого? Развитие саудовской ситуации интересно приложить к отношениям России с Западом. Конфликт показывает, что очень большие деньги могут пострадать из-за правового нигилизма одной из сторон. Даже если история закончится ничем, любые деньги любят тишину. А десятки миллиардов в Vision Fund — тем более. С этой точки зрения сама публичность истории уже подвергает инвестиции (нередко в частные компании) неоправданному риску.

+1 к продуктивности

Еще 5 вещей, которые надо сделать, когда ничего не успеваешь. Довольно наивное, но полезное исследование парадокса выбора: рост числа вариантов ведет к сокращению производительности.

Read later

«Инопланетянин» Спилберга как самый жуткий монстр в истории кино. Бывший редактор io9.com Роб Брикен считает дружбу E.T. и мальчика самым страшным кошмаром своего детства.
Огромный разбор картографического движка Apple Maps. Пока он покрывает всего 48 округов в Калифорнии и четыре в Неваде. Ключевое изменение — очень детальное изображение растительности.

Александр Амзин