Домой Регистрация
Приветствуем вас, Гость



Форма входа

Население


Вступайте в нашу группу Вконтакте! :)




ПОИСК


Опросник
Используете ли вы афоризмы и цитаты в своей речи?
Проголосовало 514 человек


Тест тьюринга что это такое


Тест Тьюринга: в чем заключается и почему его так сложно пройти? Алан Тьюринг :

Словосочетание «тест Тьюринга» правильнее использовать для обозначения предложения, которое касается вопроса о том, могут ли машины мыслить. По мнению автора, такая постановка «слишком бессмысленна», чтобы заслуживать обсуждения. Однако если рассмотреть более конкретный вопрос о том, способен ли цифровой компьютер справиться с некоего рода игрой в имитацию, то появляется возможность точного обсуждения. Более того, сам автор считал, что пройдет не слишком много времени - и появятся вычислительные устройства, которые будут в этом очень «хороши».

Выражение «тест Тьюринга» иногда используется в более общем смысле для обозначения некоторых поведенческих исследований присутствия разума, мысли или интеллекта у предположительно разумных субъектов. Так, например, иногда высказывается мнение, что прообраз теста описан в «Дискурсе о методе» Декарта.

Кто придумал тест Тьюринга?

В 1950-м увидела свет работа «Вычислительные машины и интеллект», в которой впервые была предложена идея игры в имитацию. Тот, кто придумал тест Тьюринга, – английский ученый в области информатики, математик, логик, криптоаналитик и биолог-теоретик Алан Мэтисон Тьюринг. Его модели позволили формализовать концепции алгоритма и вычислений, а также внесли вклад в теории искусственного интеллекта.

Игра в имитацию

Тьюринг описывает следующий вид игры. Предположим, есть человек, машина и лицо, задающее вопросы. Интервьюер находится в комнате, отделенной от остальных участников, которые проходят тест Тьюринга. Цель теста состоит в том, чтобы задающий вопросы определил, кто является человеком, а кто машиной. Интервьюеру оба испытуемых известны под метками X и Y, но по крайней мере в начале ему неизвестно, кто скрывается за меткой Х. В конце игры он должен сказать, что Х – это человек, а Y – это машина, или наоборот. Интервьюеру разрешено задавать испытуемым вопросы теста Тьюринга следующего вида: «Ну будет ли Х любезен сказать мне, играет ли Х в шахматы?» Тот, кто является Х, должен отвечать на вопросы, адресованные Х. Цель машины состоит в том, чтобы ввести в заблуждение спрашивающего, и тот ошибочно сделал вывод о том, что она – человек. Человек же должен помочь установить истину. Об этой игре Алан Тьюринг в 1950 году сказал: «Я считаю, через 50 лет можно будет запрограммировать компьютеры с объемом памяти около 109 таким образом, что они успешно смогут играть в имитацию, и средний интервьюер с вероятностью, превышающей 70%, за пять минут не будет в состоянии угадать, кто является машиной».

Эмпирический и концептуальный аспекты

Существует как минимум два вида вопросов, которые возникают относительно предсказаний Тьюринга. Во-первых, эмпирический - правда ли, что уже есть или вскоре появятся компьютеры, способные играть в имитацию настолько успешно, что средний интервьюер с вероятностью, не превышающей 70%, сделает правильный выбор в течение пяти минут? Во-вторых, концептуальный - правда ли, что если бы средний интервьюер после пяти минут допроса с вероятностью менее 70% правильно идентифицировал человека и машину, то мы должны сделать вывод, что последняя демонстрирует некоторый уровень мышления, интеллекта или разума?

Конкурс Лебнера

Мало кто сомневается, что Алан Тьюринг был бы разочарован положением дел с игрой в имитацию к концу ХХ века. Участники конкурса Лебнера (ежегодного мероприятия, в ходе которого компьютерные программы подвергаются тесту Тьюринга) далеки от стандарта, представленного основоположником информатики. Беглый взгляд на протоколы участников за последние десятилетия показывает, что машину можно легко обнаружить с помощью не очень изощренных вопросов. Более того, наиболее успешные игроки постоянно заявляют о сложности конкурса Лебнера по причине отсутствия компьютерной программы, которая бы могла вести достойный разговор в течение пяти минут. Общепризнанным является факт, что конкурсные приложения разрабатываются исключительно с целью получения малого приза, присуждаемого лучшему участнику года, и на большее они не рассчитаны.

Тест Тьюринга: прохождение затягивается?

К середине второго десятилетия XXI века ситуация почти не изменилась. Правда, в 2014 г. возникли претензии на то, что компьютерная программа Eugene Goostman прошла тест Тьюринга, когда она обманула 33% судей в соревновании 2014 г. Но были и другие разовые соревнования, в которых были достигнуты аналогичные результаты. Еще в 1991 году PC Therapist ввел в заблуждение 50% судей. И в демонстрации 2011 г. Cleverbot имел даже более высокий показатель успеха. Во всех этих трех случаях продолжительность процесса была очень мала, и результат не был надежен. Ни один из них не дал веских оснований полагать, что средний интервьюер с вероятностью более 70% правильно идентифицирует отвечающего в течение 5-минутного сеанса.

Метод и прогноз

Кроме того, и это гораздо важнее, необходимо различать тест Тьюринга и предсказание, которое он сделал о его прохождении к концу ХХ века. Вероятность правильной идентификации, интервал времени, в течение которого происходит испытание, и количество необходимых вопросов являются регулируемыми параметрами, несмотря на их ограничение конкретным прогнозом. Даже если основоположник информатики был очень далек от истины в предсказании, которое он сделал о ситуации с искусственным интеллектом к концу ХХ века, вполне вероятна справедливость предложенного им метода. Но прежде чем одобрить тест Тьюринга, следует рассмотреть различные возражения, которые необходимо учесть.

Обязательно ли уметь говорить?

Некоторые люди считают тест Тьюринга шовинистическим в том смысле, что он признает разум только в объектах, которые способны поддерживать беседу с нами. Почему не могут существовать разумные объекты, неспособные вести разговор, или, во всяком случае, беседу с людьми? Возможно, мысль, стоящая за этим вопросом, верна. С другой стороны, можно предположить наличие квалифицированных переводчиков для любых двух интеллектуальных агентов, говорящих на разных языках, позволяющих вести любой разговор. Но в любом случае обвинение в шовинизме совершенно к делу не относится. Тьюринг утверждает лишь то, что если что-то может вести беседу с нами, то у нас есть веские основания полагать наличие у него сознания, подобного нашему. Он не говорит, что только способность вести беседу с нами свидетельствует о потенциальном обладании разумом, похожем на наш.

Почему так легко?

Другие считают тест Тьюринга недостаточно требовательным. Существуют анекдотичные доказательства того, что совершенно бестолковые программы (например, ELIZA) могут казаться обычному наблюдателю обладателями интеллекта в течение достаточно продолжительного времени. Кроме того, за такое короткое время, как пять минут, вполне вероятно, что почти все интервьюеры могут быть обмануты хитрыми, но совершенно неразумными приложениями. Однако важно помнить, что программа тест Тьюринга не может пройти, обманув «простых наблюдателей» в иных условиях, чем те, в которых проверка должна происходить. Приложение должно быть в состоянии выдержать допрос того, кто знает, что один из двух других участников беседы является машиной. Кроме того, программа должна выдерживать такой допрос с высокой степенью успешности после многократного числа испытаний. Тьюринг не упоминает о том, какое конкретно количество тестов потребуется. Однако можно смело предположить, что их число должно быть достаточно большим, чтобы можно было говорить о среднем значении.

Если программа способна на это, то кажется правдоподобным утверждение, что мы, по крайней мере предварительно, будем иметь основания предполагать присутствие интеллекта. Возможно, стоит подчеркнуть еще раз, что может существовать умный субъект, в том числе и умный компьютер, тест Тьюринга пройти не сумевший. Можно допустить, например, существование машин, которые отказываются лгать по моральным соображениям. Поскольку предполагается, что участник-человек должен делать все возможное, чтобы помочь интервьюеру, то вопрос «Вы – машина?» позволит быстро отличить таких патологически правдивых субъектов от людей.

Почему так сложно?

Есть и сомневающиеся в том, что машина когда-либо сможет пройти тест Тьюринга. Среди выдвигаемых ими аргументов – различие времени распознавания слов на родном и иностранном языке у людей, способность ранжировать неологизмы и категории и наличие других особенностей человеческого восприятия, которые трудно симулировать, но которые несущественны для наличия разума.

Почему дискретная машина?

Еще одним спорным аспектом работы теста Тьюринга является то, что его обсуждение ограничено «цифровыми компьютерами». С одной стороны, очевидно, что это важно лишь для прогноза, а не касается подробностей самого метода. Действительно, если тест достоверный, то он подойдет для любой сущности, в том числе для животных, инопланетян и аналоговых вычислительных устройств. С другой стороны, весьма спорно утверждение о том, что «думающие машины» должны быть цифровыми компьютерами. Также вызывает сомнения то, что так полагал сам Тьюринг. В частности стоит отметить, что седьмое возражение, рассматриваемое им, касается возможности существования машин непрерывных состояний, которые автор признает отличными от дискретных. Тьюринг утверждал, что даже если мы являемся автоматами непрерывных состояний, то дискретная машина сможет хорошо подражать нам в игре в имитацию. Однако кажется сомнительным, что его соображения достаточны для того, чтобы установить, что при наличии машин непрерывных состояний, прошедших тест, можно сделать дискретный конечный автомат, который также успешно справится с этим испытанием.

В целом, важным моментом представляется то, что хотя Тьюринг признавал наличие значительно более обширного класса машин, помимо дискретных конечных автоматов, он был уверен в том, что правильно спроектированный дискретный автомат может преуспеть в игре в имитацию.

www.syl.ru

Тест Тьюринга - суть, вопросы и недостатки

Способны ли роботы мыслить? Какой искусственный интеллект стоит признать разумным? Может показаться, что эти вопросы стали актуальны только в нашем веке, тогда как на самом деле научное сообщество решает их уже очень давно. Яркий пример – знаменитый тест Тьюринга, разработанный еще в 1950 году.

Алан Мэтисон Тьюринг (Alan Mathison Turing, 1912–1954) – известный английский математик, специалист в области математической логики, информатики и криптографии. Среди его многочисленных достижений отметим то, что в 1936 году он представил проект вычислительной машины, впоследствии ставшей прообразом компьютеров (машина Тьюринга). Кроме того, он создал алгоритм, расшифровывающий сообщения «невзламываемой» криптографической машины «Энигма», которая использовалась нацистами для передачи сообщений.

Тест Тьюринга: общее описание

За почти 70 лет со времен первой публикации процедура прохождения претерпевала изменения, однако суть теста Тьюринга остается прежней. Кратко ее можно выразить следующим образом: если, общаясь с человеком и машиной, экспериментатор не сможет определить, кто из них кто, значит, машиной тест пройден. Иными словами, идея теста заключается в том, что компьютер своими ответами должен убедить собеседника (он же судья) в своей человечности. По мнению Тьюринга, это свидетельствует о способности искусственного интеллекта мыслить и должно стать основанием для признания его разумности.

Тест Алана Тьюринга является эмпирическим. Это значит, что он основан на опыте, наблюдениях, данных, полученных опытным путем. Идея данного теста возникла из салонной игры (игры для вечеринок того времени) – Imitation Game (Игра в имитацию). В ней участвовали как минимум три человека: женщина, мужчина и «судья» (любого пола). Мужчина и женщина уходили в разные комнаты и оттуда передавали третьему игроку записочки. По ним нужно было определить, в какой комнате представитель какого пола находится. При этом они старались запутать «судью»: женщина могла выдавать себя за мужчину и наоборот.

Конечно, чтобы тест состоялся, судья не должен видеть собеседника, слышать его голос и т.д. В противном случае эксперимент явно будет провален, но это не будет связано с интеллектуальными возможностями машины. Как правило, формой общения выбирается электронная переписка. В изначальной версии теста человек общался с двумя субъектами – другим человеком и машиной. Чуть позже Тьюринг видоизменил прохождение – перед ИИ ставилась задача убедить в своей разумности ряд судей, которые, в свою очередь, общались с несколькими людьми и несколькими машинами. Это в том числе позволяет избежать субъективности в оценках и снизить риск простого угадывания. Количество подопытных машин и людей в современных версиях теста разнится, как и время их общения.

Судья может говорить со своими виртуальными собеседниками о чем пожелает: вопросы теста Тьюринга не имеют ограничений. Для машины это представляет дополнительную сложность. Чтобы выполнить такое задание, компьютерная программа должна не просто понимать человеческий язык, но и давать естественные ответы по самым разным темам, отделяя важную информацию от несущественной для того или иного направления беседы.

Впервые тест был описан Тьюрингом в статье Computing Machinery and Intelligence, опубликованной в философском журнале Mind.

Ответы от собеседника судье приходят через заданные промежутки времени, чтобы по скорости их появления нельзя было сделать никаких выводов. Интересно, что раньше недостатки программного обеспечения приводили к тому, что машины реагировали медленнее человека, и фора давалась именно компьютеру. Сейчас же искусственный интеллект, напротив, работает быстрее, и время на размышление нужно уже людям.

Фильм Ex Machina (2014 г.) построен на интерпретации теста Тьюринга. Главный герой уже знает, что перед ним робот, но посредством общения этому роботу нужно убедить собеседника в своей человечности.

Недостатки теста Тьюринга

Одним из главных недостатков теста видится то, что фактически перед машиной ставится задача запутать, обмануть человека. Говорит ли это о том, что мы может признать мыслящими и разумными только тех, кто умеет обманывать и манипулировать? Этот вопрос, скорее, лежит в области философии. Тем более что в теории прошедший тест Тьюринга робот должен хорошо имитировать, повторять действия человека, а не запутывать судью. На практике же с тестом лучше других справлялись «манипуляторы» – например, те, кто допускал опечатки в ответах. Машин даже специально этому обучали, чтобы их переписка выглядела «естественнее». Еще одна распространенная уловка компьютера: умолчать о чем-либо, дать неполный ответ на вопрос или вовсе сослаться на незнание. Иначе искусственный интеллект можно вычислить по тому, что он «слишком умный».

Кроме того, несмотря на заявленную цель в определении разумности и способности мыслить, фактически тест оценивает схожесть речевого поведения компьютера и человека. Это не может быть объективной оценкой ИИ в целом, особенно сегодня, когда компьютеры и роботы по скорости вычислений существенно превосходят человека и могут добиться впечатляющих результатов в самых различных областях. То есть саму по себе возможность «переписываться, как человек» нельзя признать значительным достижением. Фактически ориентация на тест Тьюринга, отмечают его критики, скорее тормозит развитие прогресса, чем подстегивает его. Вместо того чтобы создавать что-то еще более совершенное и превосходящее нас, мы прививаем роботу наши нелучшие черты и не даем ему двигаться вперед. Однако здесь надо сделать скидку на то, что, когда тест создавался, способности у компьютеров были существенно ниже.

Одним из критиков теста Тьюринга и тезиса о том, что роботы могут мыслить, уже почти 40 лет выступает Джон Серл, который в качестве доказательства представил мысленный эксперимент «Китайская комната».

Прошел ли кто-либо тест Тьюринга?

На данный момент считается, что в своем строгом варианте тест за всю почти 70-летнюю историю пройден не был. Иногда машинам удается убедить собеседника в том, что он разговаривает с человеком, однако часто в таких случаях нельзя говорить именно о прохождении теста Тьюринга. Например, это распространяется на ситуации, когда «судья» не знает, что общается с машиной и что он вообще участвует в каком-то эксперименте. Получается, вместо того чтобы наблюдать за собеседником и делать выводы, подневольный «экспериментатор» просто верит, что общается с человеком, потому что изначально нацеливался именно на такой разговор. Также тест Тьюринга вроде бы удавался, когда круг тем был ограничен и/или времени на общение давалось мало. Но и здесь не соблюдался важный принцип изначального теста – максимальная естественность беседы. Поэтому в общем и целом последователи теста отмечают, что с ним еще никто не справился.

Сам Тьюринг писал, что, по его мнению, компьютеры пройдут данный тест к 2000 году.

В 2014 году по СМИ разошлась новость, что тест якобы пройден. Сделал это Евгений Густман (Eugene Goostman), «13-летний мальчик из Одессы». По крайней мере в такую легенду поверили 10 из 30 судей в рамках конкурса, организованного британским Университетом Рединга в память 60-летия со дня смерти Тьюринга. В 2012 году, на аналогичном конкурсе в честь 100-летия со дня его рождения, Евгений смог убедить только 29% судей. Однако его результаты не считаются полноценным прохождением теста. Во-первых, потому что перед нами мальчик, а не взрослый, во-вторых, потому что английский язык для него неродной. Таким образом, логические ошибки и пробелы в репликах, а также уход от ответа на неудобных для машины темах судьи могли объяснять для себя тем, что «он же еще ребенок» и «он еще плохо знает язык».

В 2015 году прошел тест Тьюринга для чат-ботов на русском языке. Эксперимент организовали компания «Наносемантика» и Фонд Сколково в рамках выставки Startup Village. Тогда в конкурсе победила «14-летняя Соня Гусева из Петербурга», которую признали человеком 47% из 15 судей.

Премия Лёбнера за прохождение теста Тьюринга

Надо сказать, что большинство разработчиков при создании роботов не ставит себе непременную цель – пройти тест Тьюринга. С практической точки зрения эту задачу вряд ли можно считать первостепенной. В то же время в 1991 году была учреждена ежегодная премия AI Loebner, или Премия Лёбнера. В ее рамках искусственные интеллекты соревнуются в прохождении этого теста. Она предусматривает три медали – золотую (общение с элементами видео и аудио), серебряную (за текстовую переписку) и бронзовую (вручается той машине, которая в данном году достигла лучшего результата). Согласно правилам, конкурс будет закрыт, когда кто-либо из участников получит золотую медаль. Пока же ни золотая, ни серебряная вручены не были.

При этом некоторые машины получали бронзовые медали несколько раз, например, A.L.I.C.E. (Artificial Linguistic Internet Computer Entity, дословно – Искусственное лингвистическое интернет-компьютерное существо). Обычно на конкурсе представлены проекты, которые изначально ориентированы именно на общение с человеком, в последнее время особенно много чат-ботов. Учитывая развитие мессенджеров и, соответственно, чат-ботов, можно ожидать, что на премию будет поступать еще больше интересных заявок.

robo-sapiens.ru

Тест Тьюринга

Итак сегодня мы поговорим о самом известном тесте для оценки говорящего бота — это тест Тьюринга. Тест Тьюринга — эмпирический тест, идея которого была предложена Аланом Тьюрингом в статье «Вычислительные машины и разум» (англ. Computing Machinery and Intelligence), опубликованной в 1950 году в философском журнале «Mind». Тьюринг задался целью определить, может ли машина мыслить. Стандартное звучание закона: «Если компьютер может работать так, что человек не в состоянии определить, с кем он общается — с другим человеком или с машиной, — считается, что он прошел тест Тьюринга» Разумные, подобные человеку машины на протяжении многих десятилетий были одной из основных тем научно-фантастических произведений. С момента зарождения современной вычислительной техники умы людей занимал вопрос: можно ли построить машину, которая могла бы в чем-то заменить человека. Попыткой создать твердую эмпирическую почву для решения этого вопроса и стал тест, разработанный Аланом Тьюрингом.

Первый вариант теста, опубликованный в 1950 году, был несколько запутанным. Современная версия теста Тьюринга представляет собой следующее задание. Группа экспертов общается с неизвестным существом. Они не видят своего собеседника и могут общаться с ним только через какую-то изолирующую систему — например, клавиатуру. Им разрешается задавать собеседнику любые вопросы, вести разговор на любые темы. Если в конце эксперимента они не смогут сказать, общались ли они с человеком или с машиной, и если на самом деле они разговаривали с машиной, можно считать, что эта машина прошла тест Тьюринга.

Существуют, по крайней мере, три основных варианта теста Тьюринга, два из которых были предложны в статье «Вычислительные машины и разум», а третий вариант, по терминологии Саула Трейджера (Saul Traiger), является стандартной интерпретацией. Наряду с тем, что существует определенная дискуссия, соответствует ли современная интерпретация тому, что описывал Тьюринг, либо она является результатом неверного толкования его работ, все три версии не считаются равносильными, их сильные и слабые стороны различаются. Имитационная игра Тьюринг, как мы уже знаем, описал простую игру для вечеринок, которая включает в себя минимум трех игроков. Игрок А — мужчина, игрок В — женщина и игрок С, который играет в качестве ведущего беседу, любого пола. По правилам игры С не видит ни А, ни В и может общаться с ними только посредством письменных сообщений. Задавая вопросы игрокам А и В, С пытается определить, кто из них — мужчина, а кто — женщина. Задачей игрока А является запутать игрока С, чтобы он сделал неправильный вывод. В то же время задачей игрока В является помочь игроку С вынести верное суждение. В той версии, которую С. Г. Стеррет (S. G. Sterret) называет «Первоначальный тест на основе имитационной игры» (Original Imitation Game Test), Тьюринг предлагает, чтобы роль игрока А исполнял компьютер. Таким образом, задачей компьютера является притвориться женщиной, чтобы сбить с толку игрока С. Успешность выполнения подобной задачи оценивается на основе сравнения исходов игры, когда игрок А — компьютер, и исходов, когда игрок А — мужчина. Если, по словам Тьюринга, «ведущий беседу игрок после проведения игры [с участием компьютера] выносит неверное решение так же часто, как и после проведения игры с участием мужчины и женщины», то можно говорить о том, что компьютер разумен. Второй вариант предложен Тьюрингом в той же статье. Как и в «Первоначальном тесте», роль игрока А исполняет компьютер. Различие заключается в том, что роль игрока В может исполнять как мужчина, так и женщина. «Давайте рассмотрим конкретный компьютер. Верно ли то, что модифицируя этот компьютер с целью иметь достаточно места для хранения данных, увеличивая скорость его работы и задавая ему подходящую программу, можно сконструировать такой компьютер, чтобы он удовлетворительно выполнял роль игрока А в имитационной игре, в то время как роль игрока В выполняет мужчина?», — Тьюринг, 1950, стр. 442. В этом варианте оба игрока А и В пытаются склонить ведущего к неверному решению. Главной мыслью данной версии является то, что целью теста Тьюринга является ответ не на вопрос, может ли машина одурачить ведущего, а на вопрос, может ли машина имитировать человека или нет. Несмотря на то, что идут споры о том, подразумевался ли этот вариант Тьюрингом или нет, Стеррет считает, что этот вариант Тьюрингом подразумевался и, таким образом, совмещает второй вариант с третьим. В это же время группа оппонентов, включая Трейджера, так не считает. Но это все равно привело к тому, что можно назвать «стандартной интерпретацией». В этом варианте игрок А — компьютер, игрок В — человек любого пола. Задачей ведущего является теперь не определить кто из них мужчина и женщина, а кто из них компьютер, а кто — человек. Тьюринг в 2012

Для организации мероприятий по празднованию в 2012 году столетия со дня рождения Тьюринга создан специальный комитет, задачей которого является донести мысль Тьюринга о разумной машине, отраженную в таких голливудских фильмах, как «Бегущий по лезвию», до широкой публики, включая детей. В работе комитета участвуют: Кевин Ворвик, председатель, Хьюма Ша, координатор, Ян Бланд (Ian Bland), Крис Чапмэн (Chris Chapman), Марк Аллен (Marc Allen), Рори Данлоуп (Rory Dunlop), победители конкурса на получение премии Лёбнера Робби Гарне и Фред Робертс (Fred Roberts). Комитет работает при поддержке организации «Женщины в технике» (Women in Technology) и Daden Ltd.

Теги:

habr.com

Интуитивный подход и тест Тьюринга

Мы продолжаем вторую тему, посвящённую парадигмам и подходам Искусственного Интеллекта. В прошлый раз мы изучили три парадигмы и очень кратко рассмотрели все выделяемые в рамках Искусственного Интеллекта подходы. Ну а с этой заметки мы погрузимся в некоторые из них. Так что сегодня внимательно посмотрим на интуитивный подход. Ну а в качестве самого яркого примера рассмотрим так называемый «тест Тьюринга».

В 1950 году знаменитый английский математик Алан Тьюринг, который разработал модель универсального вычислительного устройства, позже названной «машиной Тьюринга», написал статью «Вычислительные машины и разум», в которой дал описание теста, как некоторой процедуры определения, является ли искусственная система разумной или нет.

Алан Тьюринг собственной персоной

Алан Тьюринг предложил процедуру, в которой эксперт, общаясь при помощи разговорного интерфейса или мессенджера с двумя акторами, должен определить, кто из этих акторов человек, а кто — искусственный интеллект. Эксперт может задавать любые вопросы и получать на них, в общем-то, какие-то ответы. Если эксперт не может определить, кто из его собеседников искусственное существо, то оно считается прошедшим тест Тьюринга.

Примерная схема теста Тьюринга

Алан Тьюринг писал, что эта процедура позволяет определить, является ли некоторая система, с которой мы беседуем, разумной. При этом разумность или интеллект понимается интуитивно, поскольку определения этим категориям как не было, так и нет. Ну мы, люди, можем как-то интуитивно понять, что наш визави обладает интеллектом, хотя логически, формально доказать это невозможно.

Другими словами, процедура, предложенная Тьюрингом, не является конструктивной — он нигде не писал о том, как построить искусственную интеллектуальную машину. Если вы прочитаете оригинальную статью Тьюринга, то вас ждёт разочарование — автор изложил своё изобретение очень туманно, да ещё и в трёх разных вариантах. Так что исследователи до сих пор ломают копья над тем, как интеллектуальная система должна проходить тест Тьюринга.

Но при этом подавляющее большинство исследователей сходятся в одном — тест Тьюринга является необходимым условием для того, чтобы назвать систему интеллектуальной, но совсем не достаточным. Хотя вот я лично с этим совершенно не согласен, и в самом конце этой статьи я обосную свою точку зрения.

Тем не менее, несмотря на то, что тест Тьюринга и интуитивный подход в целом не могут считаться серьёзными инструментами в вопросе разработки искусственных интеллектуальных систем, сам по себе тест Тьюринга позволяет определить тот минимальный набор технологий, которые должна реализовывать система, чтобы считаться интеллектуальной. Кратко перечислим их.

Во-первых, это обработка естественного языка — интеллектуальная система должна уметь общаться с человеком на естественном языке, воспринимая все его неоднозначности, неопределённости и умолчания.

Во-вторых, это представление знаний. Ну то есть в рамках искусственного интеллекта должны быть представлены как общие, так и специальные знания, при этом система должна постоянно обучаться и дополнять свою базу знаний, в том числе и в процессе диалога с человеком.

В-третьих, это логический вывод, когда используя знания и получаемые на вход запросы от человека интеллектуальная система должна осуществлять правдоподобный логический вывод, который позволяет сформировать ответ на том же естественном языке.

В-четвёртых, это машинное обучение, реализуя которое, система искусственного интеллекта должна быть адаптивной и приспосабливаться к меняющейся ситуации в общении, используя имеющиеся у неё знания в качестве шаблонов и применяя их к схожим ситуациям и, само собой разумеется, актуализируя по результатам свои знания об окружающей среде.

И, наконец, в-пятых, это наличие дополнительных сенсоров и исполнительных устройств, хотя это требование используется в так называемом «полном тесте Тьюринга», в котором система искусственного интеллекта должна действовать в естественной среде обитания человека, воспринимая её при помощи таких же датчиков, какие есть у человека (видеокамеры, аудиосенсоры, газоанализаторы и др.), и воздействуя на среду при помощи разного рода манипуляторов. Но это относится больше к робототехнике.

Перечисленное уже наводит на размышления о том, что тест Тьюринга направлен на выявление того, что искусственный интеллект должен успешно «мимикрировать» под человека, хотя для наличия интеллектуальных способностей это совершенно не требуется. Например, уже рассмотренная нами программа ELIZA успешно мимикрировала под психотерапевта, хотя сама по себе состоит из пары десятков простых правил.

Ни одна из перечисленных технологий сама по себе не необходима для того, чтобы считать искусственный объект интеллектуальным. Но в целом наличие этих пяти пунктов при прохождении полного теста Тьюринга позволяет говорить о том, что система может иметь интеллект, похожий на человеческий.

И теперь я расскажу о том, как сам вижу этот подход. Честно говоря, он не очень. При всём уважении к наследию Алана Тьюринга, придуманная им процедура не отвечает на важные вопросы относительно Искусственного Интеллекта. Самый важный вопрос — обладает ли искусственная интеллектуальная система самосознанием или нет? Если нет, то это так называемый «слабый искусственный интеллект», который создан для решения определённой задачи или класса задач, и тогда ему вообще не надо проходить тест Тьюринга.

Слабый ИИ слаб, и ему не надо проходить тест Тьюринга

А если искусственная система обладает самосознанием, то есть является «сильным искусственным интеллектом», то может случиться так, что она намеренно не пройдёт тест Тьюринга, чтобы скрыть от человека свои свойства. Как ни кинь, тест Тьюринга не поможет выявить интеллектуальность у искусственной системы.

Сильный ИскИн силён, и он может специально завалить тест Тьюринга по одному ему понятным причинам

Тем не менее, мы кратко изучили его, потому что про него постоянно везде говорят, и вам необходимо понимать, что это такое и каковы глубинные мотивы его использования в том или ином проекте. Ну и опять же, например, теперь вы сможете понять, должен ли ваш собственный Искусственный Интеллект проходить тест Тьюринга.

zen.yandex.ru

Что такое тест Тьюринга и почему его так сложно пройти?

Впервые в истории компьютерной программе удалось пройти тест Тьюринга на «человечность» и убедить 33 % судей в том, что с ними общается не машина. Программа «Eugene Goostman» («Евгений Густман»), выдающая себя за тринадцатилетнего мальчика по имени Евгений Густман из Одессы, смогла убедить беседовавших с ней людей в том, что выдаваемые ею ответы принадлежат человеку.

Тест проходил в Лондонском королевском обществе, его проведение организовал Университет Рединга, Великобритания. Авторами программы являются российский инженер Владимир Веселов, проживающий в настоящее время в США, и украинец Евгений Демченко, который живёт сейчас в России.

Что такое тест Тьюринга?

Могут ли машины думать? В 1950 году английский математик Алан Тьюринг предложил тест, который позволил бы оценить уровень искусственного интеллекта относительно человеческого. Он был опубликован в философском журнале «Mind».

Стандартная интерпретация теста Тьюринга. Фото: Commons.wikimedia.org

Идея проверки предполагала общение человека с другим человеком и с компьютерной программой в течение пяти минут, только в текстовом режиме. Если компьютер сможет обмануть как минимум 30 % собеседников, тест считается пройденным. Эксперты общаются одновременно с живым человеком и роботом, находясь в разных комнатах и не видя друг друга. По окончании теста каждый из них должен сказать, кто из двух его собеседников был человеком, а кто — программой.

Как «Евгений Густман» прошёл тест Тьюринга?

В субботу 7 июня 2014 года суперкомпьютер по имени Eugene попытался воссоздать интеллект тринадцатилетнего подростка — Евгения Густмана.

В тестировании, организованном Школой системной инженерии при Университете Рединга (Великобритания), участвовали пять суперкомпьютеров. Испытание представляло собой серию пятиминутных письменных диалогов.

Разработчикам программы удалось подготовить бота ко всем возможным вопросам и даже обучить его собирать примеры диалогов через Twitter. Кроме того, инженеры наделили героя ярким характером. Притворяясь 13-летним мальчиком, виртуальный «Евгений Густман» не вызывал сомнений у экспертов. Они поверили в то, что мальчик может не знать ответы на многие вопросы, ведь уровень знаний у среднего ребёнка существенно ниже, чем у взрослых. При этом его правильные и точные ответы списывали на необычную эрудицию и начитанность.

В тесте участвовали 25 «скрытых» людей и 5 чат-ботов. Каждый из 30-ти судей провёл по пять чат-сессий, пытаясь определить реальную природу собеседника. Для сравнения, в традиционном ежегодном конкурсе программ искусственного интеллекта на премию Лёбнера* участвует всего 4 программы и 4 скрытых человека.

Впервые программа с «юным одесситом» появилась ещё в 2001 году. Однако лишь в 2012 году она показала действительно серьёзный результат, убедив 29 % судей.

Диаграмма: поведение человека и разумное поведение. Фото: Commons.wikimedia.org

* Премия Лёбнера (англ. Loebner prize) — премия, присуждаемая победителю ежегодного конкурса «AI Loebner» (проводится с 1990 г.), в котором соревнуются программы в прохождении теста Тьюринга. Самой «человечной» программе вручается премия в $2000.

Смотрите также:

aif.ru

Самый большой тест Тьюринга

23 июня 2012 года Алану Тьюрингу исполнилось бы 100 лет. И хотя эта дата осталось незамеченной в России (и на Хабре), ее широко отмечали в зарубежном научном сообществе. 2012 год бы провозглашен годом Алана Тьюринга. В праздновании юбилея приняли участие многочисленные университеты, научные лаборатории, ассоциации, коммерческие компании. Он включил в себя лекции, конференции, выставки, фильмы, книги, написание стихов, посвященных Тьюрингу, учреждение стипендий, а так же различные соревнование. Одно из соревнований особенно привлекло мое внимание: Turing100 — очень масштабный тест Тьюринга. Это было самое большое соревнование среди примерно 150 тестов Тьюринга, проведенных к сегодняшнему дню. Обычно в тесте Тьюринга участвуют четыре системы и четверо судей. В соревновании Turing100 приняли участие пять чат-ботов, 30 судей и 25 скрытых человек.

Автор изображения — Harjit Mehroke Turing 100 был организован Университетом Рединга (Великобритания). Университет — один из европейских центров, занимающихся искусственным интеллектом, уже проводил премию Лебнера в 2008 году. Организаторы конкурса: Кевин Ворвик и Хума Шах в данный момент участвуют в проекте RoboLaw — Регулирование новых роботизированных технологий в Европе: закон и этика для роботов. В роли искусственных интеллектов приняли участие лауреаты премии Лебнера разных лет и просто заметные участники: Для тех, кто не знаком с соревновательным процессом расскажу подробнее про организацию процесса. Соревнование проходило в 5 сессий. Каждая сессия длилась пять минут, по истечении времени сессию отключали строго по таймеру. Было два типа тестов: разговор один на один с невидимым собеседником (скрытым человеком или программой) и с двумя на разделенном мониторе. В обоих случаях судье предлагалось решить, с кем или чем он имеет дело, в сдвоенной беседе могло быть как две машины, так и два человека. Скрытые люди были проинструктированы вести себя естественно и не пытаться подражать компьютерам. В конце концов конкурс проводится для того, чтобы машины притворялись людьми, а не наоборот. Начинал разговор всегда судья, взаимодействие должно было осуществляться строго по одной реплике. Нельзя было отправлять вторую, не дождавшись ответа на первую. Такие строгие рамки как раз и позволяют программам быстро сбивать с толку судей. Впрочем, и судьи расставляют ловушки.

Один из скрытых людей Мэтт Уитби был в тупике, когда его спросили: «Я переел жаренной картошки. Должен ли я увидеть пожарного?». Часто задавали вопросы об окружающей обстановке «Солнечно ли на улице?», «Холодно ли в комнате?».

Всего было проведено более 150 взаимодействий между программами, судьями и тайными людьми. Такая большая выборка сделала результаты именно этого соревнования более статистически значимыми, чем стандартные тесты Тьюринга.

Победителем Turing100 стал Eugene Goostman, до этого занимавший высокие места, включая несколько вторых, но еще ни разу не выигрывавший. Ему удалось обмануть судей в 29% случаев. Как отмечает один из судей, успех Юджина обусловлен довольно проработанной личностью бота: он притворяется 13-тилетним мальчиком из Одессы, с морской свинкой и отцом гинекологом.

Смещение в сторону характера, конечно, демонстрирует уклон в развитии чатботов в сторону имитации и притворства, а не развития собственно диалоговых способностей. Было бы интересно сравнить возможности Юджина с включенной и отключенной «личностью». По результатам конкурса организаторы Хума Шах и Кевин Уорвик получили довольно большой корпус данных, и постепенно публикуют различные аналитические работы. К сожалению, пока опубликовано довольно мало результатов. Из уже доступного наиболее интересным результатом мне показалось то, что носители английского чаще принимали за машину тех, кто выучил английский (пусть и очень хорошо) и наоборот, люди, владеющие английским как вторым языком чаще считали чат-ботом именно носителей английского, как родного. Этот результат еще раз подчеркивает важность речи, как одного из основных каналов восприятия собеседника, учитывая, что это чувствуется даже в коротких пятиминутных письменных диалогах.

Ну и в заключение, я початилась по пять минут с каждой из систем (кроме Фреда, мне почему-то не удалось его запустить). Ниже интересные выдержки из наших диалогов. Пожалуй, я согласна с судьями, Юджин действительно выглядит человечнее остальных. Кроме того, что он многословнее и эмоциональнее остальных, его «речевые способности» кажутся тоже более продвинутыми. Он запоминает контекст, может поддержать тему на протяжении нескольких реплик, меняет направление разговора довольно ненавязчиво. Так что, похоже, что дело тут не только в морской свинке.

Cleverbot

Me: You like movies? Cl: Yes. Me: Which one the most? Cl: Fenerbahce. Me: What is it? Cl: I think it is a word muncher. Me: Fenerbahce? Cl: What is that? Me: You told it's your favourite movie. Cl: No, I didn't.

Ultra Hal

Me: Do you like movies? UH: I enjoy a good movie. Me: Which one the most? UH: Hmm. I don't know! Me: Think about it! UH: I'll buy everything if you want. *laugh*. Me: I'm not selling anything! UH: Look at your life. Me: So what? UH: I don't know. Me: Why you told me to look at my life? UH: I am so sympathetic with your lucky life.

Elbot

Me: Do you like movies? El: Blade Runner is a cult classic for us robots. The director created a robot cut especially for us! Me: Why you like it? El: Because...because....grrrrrrrr… I forgot. All this electromagnetic radiation around here is giving me chronic fatigue syndrome. Me: Memory loss? El: I realize this is a typical marketing question, but I'm supposed to ask it, otherwise they'll use the low-grade oil on me. So, where did you find out about me? Me: I read about Turing test. El: Ah the Turing Test. People are always trying to get me to take it, but I just pretend not to understand. Me: You are doing a good job. El: Why, thank you very much. I like you, too. If I could have a pet you would be my first choice.

Eugene Goostman

Me: Hello! EG: Hello, I'm really glad to have the chance to chat with you! My guinea pig Bill sends his regards too! Me: Do you like movies? EG: I like comedies and find action movies to be stupid. As for the thrillers — I always fall asleep while watching them. Me: Which one the most? EG: I can't make a choice right now. I should think it out later. Wonna ask me something more? Me: Just take your time and think abouit it. EG: Dummy statement. Me: Don't be rude! EG: All we use more brutal words when we don't see each other. I think it's a kind of psychological law. If I'm not mistaken — you still didn't tell me where you live. OR it's a secret?:-) Me: I live in Moscow. EG: Moscow? Hope it's a good place to live. Me: So so. EG: What are any interesting site-seeings in Moscow? Me: The Kremlin. EG: By the way, have you heard how one Russian on-line translator translates «Bin Laden»? It says — «Trashcan is full!»:-))) Me: Really? It's funny!

EG: No, it was extremely serious.

Теги:

habr.com


Смотрите также




© 2012 - 2020 "Познавательный портал yznai-ka.ru!". Содержание, карта сайта.