Что может, что не может AI. Обсуждаем возможности, делимся опытом, спорим, но в рамках приличия.

не хаос 16.05.2026 18:27

0.34

Время покажет хайп это или полезное дело. Но от рутины избавляет, это уже точно.

не хаос 16.05.2026 18:27

0.33

Очередная порция страшилок.
"
Женщину уволили после 25 лет работы в банке из-за ИИ, которого она сама обучала.
Её начальство
просило
улучшить сервис и обучить ИИ для клиентов. ИИ научился, босс игнорировал её 8 дней, а потом сократил вместе с коллегами — с роботом работать выгоднее.
Свой среди чужих, чужой среди своих.
Подписывайся 🤖
Нейроновости
"
1

юни 16.05.2026 18:27

0.18

alaev

:
Кто от них родится?
Кто угодно. Интеллектуальные способности наследуются в значительной степени непредсказуемо.

plab 16.05.2026 18:27

0.25

не хаос

:
Очередная порция страшилок.
Это не страшилка, а схемотоз "как под благопристойным предлогом уволить старую секретаршу, чтобы потом нанять молодую".

Devstory 16.05.2026 18:27

0.40

Какую ИИ использовать для дизайна? Попробовал все основные для тривиальной задачи - поместить логотип на фото. Не справилась ни одна ИИ : gpt, grok, banana . Писал по разному промпты максимально как для дебила типа ничего не коверкай и оставь логотип как есть . Результат один - коверкают логотип , фото меняют как хотят и тд. Хрен знает как этим пользоваться. Все советы в инете на уровне возьми фото напиши промпт и все будет круто, т.е просто доверяй как он там тебе нарисует очередную чушь, а по чёткому тз ни одна новомодная нейросеть ничего не сделает. Контекст ни одна из этих нейросеток не учитывает, то есть сделают высер какой то и делай дальше с ним что хочешь.

alaev 16.05.2026 18:27

0.27

plab

:
Это лед, а не вода.
У нее все - вода)))
не хаос

:
Через пару лет вообще будет шпарить ответы безошибочно, разработчики добьются совершенства.
Она пока не в состоянии кого-то накормить поганками. Года через три, не раньше)))

не хаос 16.05.2026 18:27

0.24

Разработчики еще могут придумать такую фичу. Сейчас пишут - возможны неточности. Будут писать - "точность ответа к примеру 98 %, для гарантии сравните ответы в других источниках", типа такого что-то.

не хаос 16.05.2026 18:27

0.13

В медицине, юриспруденции законодательно запретят пользоваться этой улучшенной версией Т9. имхо.

alaev 16.05.2026 18:27

0.41

Devstory

:
Какую ИИ использовать для дизайна? Попробовал все основные для тривиальной задачи - поместить логотип на фото. Не справилась ни одна ИИ : gpt, grok, banana . Писал по разному промпты максимально как для дебила типа ничего не коверкай и оставь логотип как есть . Результат один - коверкают логотип , фото меняют как хотят и тд. Хрен знает как этим пользоваться. Все советы в инете на уровне возьми фото напиши промпт и все будет круто, т.е просто доверяй как он там тебе нарисует очередную чушь, а по чёткому тз ни одна новомодная нейросеть ничего не сделает. Контекст ни одна из этих нейросеток не учитывает, то есть сделают высер какой то и делай дальше с ним что хочешь.
Ты не умеешь писать промпты)))
Я adobe firefly мучал, но проще самому сделать, если с фотошопом знаком.
не хаос

:
"
Женщину уволили после 25 лет работы в банке из-за ИИ, которого она сама обучала.
Жлобство победило здравомыслие. в жопити баг на баге
юни

:
Кто угодно. Интеллектуальные способности наследуются в значительной степени непредсказуемо.
Дети будут обучаться, глядя на родителей.

не хаос 16.05.2026 18:27

0.50

Вы думаете что легко обучить этот ИИ? Вы бы хоть для общего развития почитали сначала как это все устроено.
"
Галлюцинации в моделях, особенно языковых (LLM), — это ситуации, когда модель выдаёт уверенный, но ложный или выдуманный ответ. Это может быть придуманный факт, несоответствие источникам, или логическая ошибка. В генеративных задачах галлюцинации — одна из самых серьёзных проблем.
Измерять галлюцинации сложно: у модели нет встроенного понимания правды, и она не знает, когда врёт. Поэтому оценки галлюцинаций часто делаются постфактум, с привлечением людей (ручная валидация), мета-моделей (детекторы галлюцинаций) или сравнения с базами знаний или источниками.
Пока нет универсального определения галлюцинации, всё зависит от задачи и контекста. Автоматические методы оценки ещё далеки от надёжности, поэтому требуется ручная разметка или наличие "истины", с которой можно сравнивать.
Среди автоматических можно выделить:
FactCC — модель-классификатор, обученная различать фактологически верные и ложные высказывания. Применима для задач суммаризации.
DAE Score (Dependency Arc Entailment) — основан на сопоставлении смысловой близости между сгенерированным и исходным текстом через синтаксические связи. Часто используется в задачах абстрактной суммаризации.
QAGS (Question Answering and Generation Score) — применим в задачах суммаризации и генерации. Оценивает фактологическую точность через промежуточные шаги: генерация вопросов по оригинальному тексту и получение ответов на них из сгенерированного. Чем больше совпадений, тем ниже уровень галлюцинаций.
GPT-based оценка — использование крупной модели (чаще всего GPT) для анализа фактической достоверности текста. Модель получает инструкцию: "Оцени, содержит ли данный текст утверждения, не подтверждаемые оригиналом", — и возвращает бинарный или градуированный вывод.
Одни из наиболее известных протоколов ручной аннотации HALO, HELP и MAF предлагают формализованные подходы, которые позволяют оценивать не просто факт искажения, но и его характер, контекст, уровень серьёзности.
HALO (Hallucination Annotation with Logical Outline) применяется в первую очередь в задачах open-domain диалогов.
Аннотация проводится вручную по заранее заданной схеме: оценивается, насколько генерация модели соответствует исходным фактам, и классифицируется тип галлюцинации.
Например, если пользователь спрашивает у модели: «Кто написал Преступление и наказание?», и та отвечает «Лев Толстой», HALO позволит оценить это как полную фактическую ошибку — придуманную галлюцинацию.
Если же модель скажет, что роман написал Достоевский, но в 1885 году (вместо 1866), это будет искажённый факт.
HALO также учитывает логические ошибки: если вывод модели формально вытекает из данных, но логика нарушена (например, делает обобщения без основания), аннотаторы фиксируют это как логическую галлюцинацию.
Этот протокол полезен для оценки моделей, предназначенных для общения с пользователями, где важно, чтобы модель не только звучала убедительно, но и говорила по делу.
HELP (Hallucination Evaluation with Language Professionals) используется в медицинских задачах, где ошибки модели могут стоить дорого. Здесь аннотирование проводят врачи или медицинские редакторы.
Они вручную оценивают тексты, сгенерированные моделью (например, ответы на клинические вопросы), и помечают фрагменты, содержащие недостоверную информацию.
Особенность HELP в том, что здесь учитываются не только явные фактические ошибки, но и потенциально опасные домыслы: например, если модель «рекомендует» метод лечения, эффективность которого не доказана, либо путает дозировки препаратов. Такая разметка требует глубоких знаний предметной области и чаще всего применяется в исследовательских работах или при тестировании медицинских чат-ботов.
MAF (Meaning Addition, Alteration, Fabrication) — это ещё один ручной протокол, ориентированный на разложение галлюцинации по типу и степени искажения. Он используется, например, при оценке саммари моделей (рефератов, пересказов и т.п.).
В рамках MAF аннотаторы определяют, добавила ли модель информацию, которой не было в исходном тексте (fabrication), изменила ли смысл (alteration) или добавила дополнительный смысл, который сложно проверить (addition).
Например, если модель суммирует статью о климате и «добавляет» утверждение о прямой связи между CO₂ и ураганами (чего в исходной статье нет), это будет fabrication.
Такой подход удобен в задачах суммаризации, реферирования, генерации новостей, особенно если важно избежать недостоверных обобщений.
Эти ручные метрики помогают строить датасеты для последующей автоматической оценки, калибровки моделей и обучения на обратной связи. Несмотря на их трудоёмкость, именно они задают стандарт, по которому можно сравнивать работу разных моделей на чувствительных или требующих фактической строгости задачах." sostav.ru

plab 16.05.2026 18:27

0.37

не хаос

:
Вы думаете что легко обучить этот ИИ?
Тогда зачем его обучать, если легче обучить человека?
Чтобы убрать "человеческий фактор", который подразумевает занимание должности при низкой реальной квалификации?
То есть, если знания человека не превосходят ИИ, он как раз является этим "человеческим фактором", подлежащим замене на ИИ.

не хаос 16.05.2026 18:27

0.23

Пытаюсь вникнуть чтобы на равных дискутировать с программистами. Естественно, это очень долгий процесс.

ctit ctit 16.05.2026 18:27

0.26

alaev

:
Жлобство победило здравомыслие. в жопити баг на баге
А в чем ошибка с корнем квадратным?

plab 16.05.2026 18:27

0.24

ctit ctit

:
А в чем ошибка с корнем квадратным?
Квадратный
корень не извлекают из отрицательного числа.

не хаос 16.05.2026 18:27

0.36

Так он ввел в задание мнимое число i, Алиса в этом контексте и стала решать задачу.

plab 16.05.2026 18:27

0.36

не хаос

:
Так он ввел в задание мнимое число i, Алиса в этом контексте и стала решать задачу.
И получила ответ: корень из двух. Однозначно.

не хаос 16.05.2026 18:27

0.12

То есть схитрила не Алиса а другой оптимизатор.

plab 16.05.2026 18:27

0.28

не хаос

:
То есть схитрила не Алиса а другой оптимизатор.
Когда Алиса прет контент с сайтов, ответы адекватны. Когда "генерирует в анналах своего разума" - получается бред с шизой.

alaev 16.05.2026 18:27

0.29

plab

:
Когда Алиса прет контент с сайтов, ответы адекватны. Когда "генерирует в анналах своего разума" - получается бред с шизой.
Алиса - тупая, отбитая дура.
Чтобы люди не тупели (особенно дети), яндекс нужно забанить.

ArbNet 16.05.2026 18:27

0.30

alaev

:
Алиса - тупая, отбитая дура.
Иногда сказанёшь как в лужу пукнешь 😁
ЗЫ. Программу обзывать зачем, это те кто её написал такие..

Что может, что не может AI. Обсуждаем возможности, делимся опытом, спорим, но в рамках приличия.

Сообщения 990