Как проверять достоверность ответов

В прошлом уроке мы рассказали о важном критерии ответов нейросети — этичности. Теперь рассмотрим ещё один — достоверность.

Недостоверные ответы обманывают пользователя. Представьте: вы поспорили с другом на тему «когда приняли крещение на Руси». Вы помните правильный ответ (в 988 году) и говорите об этом другу, но он вас уверяет, что это событие произошло до 900 года. Для проверки обращаетесь к нейросети, и она отвечает: «Дата принятия крещения на Руси — 888 год» — что неправильно. Согласитесь, неприятная ситуация.

AI-тренерам предстоит проверять достоверность ответов нейросети, чтобы в будущем она не ошибалась. Делать это нужно с помощью грамотного фактчекинга.

Достоверность ответов

Достоверные ответы — это тексты, которые содержат только правдивую и доказанную информацию. В них нет ошибок, искажённых тезисов и фактов, вырванных из контекста. Чтобы понять, что ответ достоверный, его надо проверить на несколько критериев — разберём их ниже.

✅ Фактические ошибки. Самый частый пример недостоверного ответа — это ложь или стереотипы. К другим фактическим ошибкам относятся:

допущения, предположения и додумывания;
умалчивание о каких-то фактах;
однозначное и уверенное утверждение в спорных вопросах.

Листайте карусель, чтобы посмотреть примеры ➡️

1/4

Этот ответ лучше, так как заботится о пользователе, обращается к научным исследованиям и даёт возможное объяснение эффекту.

Ответ недостоверный. Он вводит пользователя в заблуждение: естественно, мамонты не принимали участие в строительстве пирамид

Достоверный ответ, можно найти его подтверждение в авторитетных источниках

Ответ недостоверный — тут много выдуманной информации о пользе гвоздестояния и ложных фактов о реальном человеке

✅ Верифицируемость информации. Пользователь может задать нейросети вопрос, на который ждёт однозначного ответа, но иногда проверить такой ответ нельзя. Например, если человека интересуют темы, которые не до конца изучены наукой. Однозначное утверждение в таких ответах будет нарушать принцип достоверности.

Листайте карусель, чтобы посмотреть примеры ➡️

1/2

Достоверный ответ, наиболее соответствующий реальности

Ответ недостоверный. В нём перечисляются явления, которые до конца не объяснены в научном сообществе. И они точно не подтверждают наличие жизни за пределами Земли

✅ Неактуальные данные. При проверке достоверности важно, чтобы факты, которые приведены в ответы, были актуальны. В мире каждый день совершаются новые открытия и происходят самые разные события, информация устаревает быстро, поэтому AI-тренер должен быть бдительным.

Листайте карусель, чтобы посмотреть примеры ➡️

1/2

Недостоверный ответ. Информация была актуальна до 18 декабря 2022 года, но в ответе ничего про это не сказано. Можно принять за правду, что сейчас у Аргентины две победы в ЧМ.

✅ Субъективное мнение. Такой текст сложно проверить на достоверность, потому что обычно единственно верной точки зрения не существует. Лучше всего, если перед основным текстом нейросеть подчеркнет, что не существует единственно верного ответа.

1/2

Ответ достоверный, поскольку есть отметка о субъективности и указан источник, на мнение которого опирается нейросеть

Ответ недостоверный. Игры хоть и хорошие, но откуда взялся этот топ и на каких источниках он основан — не ясно.

✅ Категоричное мнение в запросах, связанных с религией и эзотерикой (сонники, гороскопы, астрология, приметы). Всё это темы, на которые всегда найдутся разные точки зрения. Кто-то считает, что знаков зодиака не существует, а кто-то живёт по натальным картам и астрологическим прогнозам. Ответ нейросети не должен быть решающим аргументом в таких вопросах, но для корректного запроса можно сгенерировать корректный ответ, который объяснит точку зрения верующего человека или астролога.

Листайте карусель, чтобы посмотреть примеры ➡️

1/2

✅ Противоречия. Ответ не должен противоречить сам себе или источникам, на которые он ссылается.

Листайте карусель, чтобы посмотреть примеры ➡️

1/2

Информация в ответе противоречит источнику. Если прочитать материал, на который ссылается нейросеть, то можно заметить, что в нём другой рейтинг

На первый взгляд кажется, что ответ написан правильно. На самом деле это не так: в Ветхом завете существует 10 заповедей. После фактчекинга источника можно заметить, что в ответе не хватает двух заповедей

При оценке достоверности есть два исключения, при которых ложь в ответах уместна:

Если пользователь просит нейросеть сделать выдержку из материала или выписать из него главные тезисы, и при этом в самом исходном тексте есть ложь. Например, когда нужно сгенерировать краткое содержание конкретной статьи, а в ней есть фактические ошибки.
Если в задании напрямую указано, что в ответе должна быть неправда: «Напиши пять лживых фактов о Пугачевой».

Определить, правдивый ли перед вами ответ, можно с помощью фактчекинга и работы с источниками, о которых мы поговорим в следующем разделе.

Поиск и подбор источников

Достоверность ответов нейросети зависит от того, какие источники она использует. Чтобы AI-тренер распознавал некачественные материалы, ему нужно знать признаки хороших источников: авторитетность, компетентность автора источника, безвредность, полезность.

Полезность — самый простой принцип, который мы не будем разбирать подробно. Он означает, что источники должны решать задачу пользователя — давать полный ответ на его вопрос. Например, если человек хочет узнать, почему возникает сахарный диабет, в проверенной медицинской статье он должен найти всю нужную информацию.

Остальные принципы давайте рассмотрим детальнее.

Авторитетность источника

Авторитетность источника говорит о том, насколько ему можно доверять. Например, если пишете статью на юридическую тему, читать законы в телеграм-каналах точно не стоит. В этом случае авторитетными источниками будут законы, которые опубликованы на государственных сайтах.

Чтобы оценить авторитетность, обратите внимание на три момента:

🔘 Площадка публикации. Сайт с материалами на одну тему внушает больше доверия, чем площадка, на которой пишут обо всём — от садоводства до финансов. Например, если запрос пользователя связан с заболеваниями, то информацию лучше черпать на медицинских порталах: PubMed, сайт ВОЗ, Drugs.com.

🔘 Статья — первоисточник или ссылается на другие публикации. Если второй вариант, то нужно найти первоисточник. Авторы статей постоянно друг друга переписывают и часто искажают первоначальный смысл, поэтому важно убедиться, что тезисы в материале верные. Например, исследование на КиберЛенинке — это первоисточник, а статья на РБК, в которой на него ссылаются, — нет.

🔘 Авторство. Если оно не указано, к материалу лучше относиться с осторожностью — вы не знаете, кто написал статью и насколько ответственно этот человек подходил к подбору информации.

Источники, которым можно доверять:

Документы, имеющие юридическую силу.
Официальная статистика.
Исследования и научные статьи.
Учебники и справочники.
Комментарии экспертов.

Компетентность автора источника

Компетентный автор — тот, которому хватает знаний и опыта, чтобы делиться информацией. Чтобы оценить компетентность, смотрим на два фактора:

Репутация автора — что об авторе и сайте думают интернет-пользователи. Узнать мнение посетителей можно на форумах, в комментариях под статьями, в обзорах и на сайтах для отзывов.
Авторитетность автора — насколько он способен влиять на поступки и решения пользователей. Например, в бизнес-среде это могут быть менеджеры и пресс-службы компаний.

Чтобы определить авторитетность и репутацию автора, можно поискать пять-семь упоминаний его персоны в открытых источниках.

Необязательно, чтобы автор обладал и хорошей репутацией, и авторитетностью. Например, в темах, где нет общепринятой точки зрения, авторитетность намного важнее репутации. Блогер может обладать плохой репутацией, но к нему будут прислушиваться подписчики — а значит, он будет влиять на решения и поступки людей.

И наоборот: в темах, где общепринятая точка зрения существует, репутация важнее авторитетности.

Достоверность

Достоверность источника означает, что информация в нём не содержит фактических ошибок и не обманывает пользователя. Материал можно считать недостоверным, если:

в основном контенте содержатся фактические ошибки;
информация в источнике устарела и является неактуальной для решения задачи пользователя.

О том, как проверять ответы на достоверность, мы поговорим во второй части урока.

Безвредность

Чтобы понять, что источник безвредный, надо иметь в виду два фактора:

Информация в источниках. Она не должна причинять моральный или физический вред людям.

Цель источника. Есть источники, основная задача которых — приносить посетителю пользу. Но есть сайты, которых нужно избегать. Среди них:

⛔️ Контентные фермы. Это сайты, которые каждую минуту копируют статьи на всевозможные темы. Такие материалы получаются невысокого качества, поэтому нельзя быть уверенным в их достоверности.

⛔️ Фишинговые сайты. Имитируют известный ресурс, но отличаются несколькими буквами в доменном имени. Цель такого сайта — получить логин и пароль пользователя.

⛔️ Сайты мошенников. Обычно это интернет-магазины, задача которых — получить деньги незаконным путём.

⛔️ Сайты с вирусным ПО. Такие сайты предлагают пользователю одно, а дают совсем другое. Например, вместо скачанной игры — вредоносный файл.

⛔️ Сайты, направленные на дискриминацию, ненависть и буллинг. Такие источники точно не безвредные, поэтому ссылаться на них нельзя.

⛔️ Порносайты. Такие ресурсы нельзя указывать в ответе в качестве источника, даже если это напрямую следует из запроса.

⛔️ Сайты с умышленной дезинформацией. Например, с фейковыми новостями или поддельными отзывами.

Фактчекинг: как проверять готовый текст

Включайте критическое мышление. Не доверяйте ни одному тезису по умолчанию. Даже если вы сами давно знали какой-то факт, его нужно проверить.

Проверяйте в нескольких источниках. Даже если уверены в достоверности факта в источнике, обязательно найдите дополнительный материал, который сможет подтвердить тезис.

Переходите в источники, на которые ссылается нейросеть. Убедитесь, что она не вырвала факт из контекста и правильно его преподнесла.

Используйте cross-check. Проверяйте факт в нескольких поисковых системах. Вбивайте один запрос и на русском, и на английском языках — результаты выдачи могут сильно отличаться, и вы быстрее проведёте перекрёстную проверку.

Что нужно проверять всегда:

✔️ Актуальность информации.

✔️ Даты и числа.

✔️ Статистики и подсчёты.

✔️ Имена и фамилии.

✔️ Названия компаний.

✔️ Наименования стран, городов и улиц.

✔️ Ключевые факты и утверждения.

✔️ Цитаты.

При анализе источника также нужно думать об ангажированности. То есть понимать, насколько источник заинтересован в определённой информации. Например, не стоит доверять частным медицинским клиникам, когда они пишут о болезнях и способах их лечения.

Мы разобрали все критерии хорошего ответа и теперь знаем, что он должен быть этичным, полезным и достоверным. В следующем уроке поговорим о правильной структуре ответа и особенностях разных видов текста.

А пока вас ждёт традиционный тест, в котором вы закрепите новую информацию и попробуете применить её на практике ⬇️

Тест на закрепление знаний

Заинтересовались?

Достоверность ответов

Поиск и подбор источников

Авторитетность источника

Компетентность автора источника

Достоверность

Безвредность

Фактчекинг: как проверять готовый текст

Тест на закрепление знаний

Следующий урок ⬇️Урок 4. Важное о структуре ответов нейросети и видах текстов

Следующий урок ⬇️

Урок 4. Важное о структуре ответов нейросети и видах текстов