Тема#3 Как поставщикам упаковки подготовиться и улучшить взаимодействие с ИИ

admin

Введение в тему
Условия деятельности на рынке постоянно меняются: появляются новые технологии, новые способы взаимодействия контрагентов, меняются условия конкуренции. Нейросети — один из главных технологических прорывов. Разработка и создание LLM (large language models, большие языковые модели), а также развитие использующих их чат-ботов вскоре изменит многое, что однозначно приведет к повышению активности на рынке товаров и услуг. Возможно, Вы еще не заметили, но боты уже частые гости на сайтах ваших компаний.

В этой теме мы начинаем собирать идеи и советы о том, как поставщикам упаковки подготовиться к взаимодействию с искусственным интеллектом и AI ассистентами заказчиков упаковки, так как есть большая вероятность, что из новой технологии ИИ превратится в ключевой фактор, привносящий динамику в развитие отрасли. Но, прежде чем читать материалы ниже, настоятельно советуем изучить темы:
AI ассистенты инженера разработчика упаковки
AI ассистент закупщика упаковки 1) 2)

Неочевидные причины для внедрения ИИ
Со стороны новых заказчиков:
Увеличивается само количество и в целом % заказчиков без экспертизы/знания рынка.
Нечеткое понимание предмета закупки и нежелание углубляться в спецификацию.
Заказчики ожидают быстрых ответов, но сами, зачастую, не готовы коммуницировать.
Поиск упаковки/поставщика в Tелеграм группах (потенциально в чат-ботах) все чаще дополняет или заменяет поиск через Yandex (Google потеряли давно, что не так с Yandex поиском?).
При этом впечатления от опыта взаимодействия по прежнему остаются надолго.

На стороне поставщиков поставщиков:
Недостаток ресурса для быстрой обработки запросов.
Возрастают затраты времени на прояснение нечетких потребностей и множество справочных уточнений.
Дистрибьютеры быстрее учатся «подхватывать» новые потребности.
Конкурировать новинками или сервисом?

Почему важно действовать сейчас?
Ранние адоптеры получают конкурентное преимущество, устанавливают стандарты в отрасли, поддерживают статус и улучшают отношения.

От простого к сложному
Так видит взаимодействие Дмитрий Москвин, исполнительный директор "Интеллектуальных технологий:
"Бот от заказчика формирует заявку и опрашивает рынок, бот от поставщика предлагает товары и условия поставки, а человек здесь нужен только на ключевых этапах, чтобы подтвердить проект решения о сделке, предложенного системой".

В запросе, кроме возможности поставки и цены, будут следующие поля:
Информация о наличие запрашиваемого количества на складе или сроки поставки;
Мин объем/квант отгрузки из наличия и объем под заказ;
Другая техническая информация, в т.ч. про макет заказчика.

Уже на этом шаге можно задуматься, что еще будет присылать бот?
Запрос на подписание NDA перед запросом цены? Просьбу выслать ТУ, чертеж, паспорт качества и тп, количество на поддоне и машине?
Такие рутинные запросы отнимают время и энергию у специалистов, которые их обрабатывают, front office при необходимости, также передает запрос другим функциям.
Именно с целью оптимизации таких рутинных коммуникаций и сокращения потерь времени запускаются чат-боты и ИИ ассистенты.

Параллельные вопросы:
Куда бот будет присылать запрос? На почту указанную на сайте? А если у вас указаны почтовые ящики бухгалтера, логиста, и всех региональных представителей, не передумает ли такой AI ассистент?
Пригодится ли специальный почтовый ящик типа ai@доменкомпании.ru для сообщений от ИИ, ведь большинство поставщиков даже сообщения от телеграм ботов еще принимать не могут.
Если в сообщении будет ссылка для заполнения формы ответами, можно ли по ней переходить?

И будет ли свой принимающий бот, оборонять такой ящик от спама, перераспределять запросы в нужные функции?
Нужно ли вообще принимать такие запросы? Как оградиться от запросов ботов конкурентов и не рассказать лишнего?

Пока все боты такого типа работали на основе RPA. Роботизированная автоматизация процессов (RPA) обещала революцию в операционной работе: от ввода данных до обработки документов. Однако классические RPA-решения оказались ограниченными – они просто имитировали действия человека, что делало их негибкими и дорогостоящими.
Теперь приходит автоматизация на базе ИИ.
С развитием генеративного искусственного интеллекта и больших языковых моделей (LLM) появилась возможность настоящей интеллектуальной автоматизации. Теперь агенты ИИ могут понимать конечные цели, адаптироваться к изменениям и работать с разнородными данными без необходимости дорогих консультантов. Распространенные проблемы решаются оперативно, что повышает удовлетворенность клиентов. По мере того, как упаковочные компании внедряют решения для поддержки клиентов на базе искусственного интеллекта, они не только повышают удовлетворенность клиентов, но и получают ценную информацию о поведении потребителей. Такое стратегическое использование искусственного интеллекта закладывает основу для....допишите сами

Встает вопрос - как/чем прямые поисковые запросы ИИ ассистентов заказчиков на основе общих платформ будут отличаться от запросов специализированных платформ или порталов агрегаторов и чем от текущих поисковых машин Yandex или текущих RPA ботов?
Чем больше платформа будет "заточена" на упаковке, тем полнее и точнее будет форма запроса, которую пришлет бот.
Но на самом деле, первичная забота - это не форма запроса и его содержание, а будет ли он доставлен правильным адресатам.

PackAudit&Consulting

У поставщиков есть опыт размещения в каталогах сведений о своей упаковке, - обычно им необходимо отнести ее к определенной категории: бумага, полиграфическая продукция, полимерная упаковка и т.п. Ранее им приходилось вручную выбирать нужную категорию из длинного списка, на что уходило много времени, но это даже не главное, непрофессионально составленный каталог упаковочных категорий с невнятными обозначениями изделий мало кому нравился и не сильно помогал в выборке нужных поставщиков, - заказчики тоже теряли время.
Сейчас нейросеть избавила поставщиков от рутинной процедуры. Достаточно загрузить изображение продукции, и искусственный интеллект за несколько секунд проанализирует предложенную картинку, после чего предложит подходящие категории на выбор. Что-то подобное сейчас реализовывает Портал поставщиков.
Вопрос в точности, какие категории будут предложены моделью зависит от того, кто ее учит. Профессионалам рынка важен поиск не только по категории упаковки, но и по корзине/технологии и даже по конкретному упаковочному изделию в ней.
Когда формировались базы поставщиков упаковки для @Packselection_Ru_bot в телеграм в них была заложена логика именно детального каталога упаковки. На основе этого каталога и содержания баз можно с помощью машинного обучения создать продвинутый вариант нейросети для поиска упаковки нужной категории, корзины/технологии и даже варианта укупорки для специфичного стандарта горла.

Верите ли Вы в следующий запрос через платформу ИИ?
"Найди аналоги такой бутылки как у производителя Y по этой ссылке, главные параметры такие то, и отдельно покажи отличия, лучше на чертеже.
Будете ли вы скрывать свои упаковочные изделия или сделаете так, чтобы их сразу находила поисковая машина?

Стандартная товарная единица (СТЕ) - очевидная полезная вещь. Согласно логике Портала поставщиков zakupki.mos.ru/ она создается под себя самим заказчиком, который уже знает, что необходимая позиция (потребность) может быть закрыта несколькими поставщиками и ее можно квотировать. Эта позиция может быть кастомизированной, т.е. изготавливаемой только под этого заказчика, но есть позиции индустриальных стандартов (commodity), такие как алюминиевые банки, преформы одинакового веса и типа горла, крышки и т.п. это уже действительно признанные рынком Стандартизированные товарные единицы.
Уже сегодня применяются технологии машинного обучения для поиска соответствия между похожими товарными единицами в карточках товара, тема развивается.

С помощью баз @Packselection_Ru_bot таким сопоставлениям обучить специализированную для упаковочной отрасли модель смогут даже студенты. Запрос от любой ИИ платформы, пройдя каталог с помощью специализированной модели, найдет, кто производит такие изделия и отправит точный запрос нужным поставщикам упаковки. Вышеуказанный бот может делать это и сегодня, попробуйте сами, но не так быстро, как будет, когда дооснастится ИИ.

Будут предоставлены и другие возможности, если посмотреть внимательно.
Для поставщиков - сравнение и оптимизация работы со своим каталогом и ценовым предложением, определение свободных (перспективных) товарных ниш для инвестиций в разработку упаковочных решений.

Для заказчиков - помощь в выборе вариантов успешной бизнес-стратегии (использование уникальных/редких упаковочных решений или массово доступных/стандартизованных) на основе оценки количества предлагаемых вариантов и необходимости выделиться.

Новые возможности будут особенно актуальны для компаний, которые широко используют анализ больших данных для конкурентного сравнения.

admin

Вернемся к этой большой подтеме попозже.

А пока посмотрите внимательно на страницы по ссылке
https://pcgroup.ru/products/flakon-fv-15-20-os-bsz/
https://perint.ru/catalog/packing/kolpachki-kryshki-probki/kolpachok-kapsula-25ml/

https://cart-power.ru/blog/idealnaya-kartochka-tovara-seo/
https://dh-agency.ru/mikrorazmetka-tovarov/

Есть большая вероятность перехода от статичных записей номенклатурных позиций к условно [b]параметрическим карточкам товара[/b], благодаря чему система заказчика будет подбирать допустимые аналоги, имеющие преимущества по цене, качеству и доступности.

Перечень характеристик товара - параметрические и экономические характеристики товара, уровень качества (примеры):
Параметрические характеристики, потребительские свойства (типоразмеры, вкус, запах, цвет и т.п.)
Надежность товара.
Экономичность товара.
Эргономические характеристики изделия.
Дизайн.
Факторы моды.
Факторы престижа.
Свойства, образующие “критическую массу” набор свойств (технических новшеств) с которыми у потребителя ассоциируется представление о высококачественном товаре.
Многофункциональность, универсальность.
Факторы индивидуализации (ориентация на отдельные сегменты, учет национальных, религиозных и др. особенностей потребителя).
Элементы, отличающие товар и способствующие его узнаванию среди аналогичных товаров.

Степень совместимости товара с другими товарами, использующимися потребителем.

Технологический пакет (набор сопутствующих товаров, способствующих более эффективному использованию изделий).
Экологичность товара.
Характеристика влияния товара на здоровье потребителя.
Соответствие стандартам, нормативным актам.
Уровень качества.

Качество упаковки товара (сохранность товара, функциональность, удобство, относительная дешевизна, эстетичность, оригинальность, возможность рекламного использования).
Удобство расфасовки товара (на всех этапах производства, транспортировки, продажи, использования потребителем).

Качество инструкции к товару (простота, исчерпываемость, информативность).

Соответствие объема производства товара реальному и потенциальному спросу.

Ценовые характеристики.
Соответствие цены товара платежеспособности данного сегмента потребителей.
Соответствие цены товара издержкам производства и продвижения.
Технология ценообразования, ее соответствие целям фирмы, характеру конъюнктуры:
скользящая цена, снижающаяся по мере насыщения рынка;
устойчивая, долговременная цена;
преимущественная цена (снижение цены за счет увеличения объема сбыта и экономии на реализации продукции - при условии доминирования фирмы на рынке);
демпинговая цена.

Технология платежа, ее соответствие задачам фирмы по стимулированию спроса:
кредиты;
скидки;
возможность отсрочки платежа;
возможность покупки товара не за счет личных средств сегмента.
Наличие гарантии цен в соответствии с сортностью товара.
Налчие договорных цен для некоторых потребителей при выполнении ими ряда условий (круг потребителей, перечень возможных условий, уровень снижения цены)

Возможность снижения цены для постоянных потребителей, имеющих статус “постоянного клиента”.
Методы товародвижения и сбыта.
Формы и методы транспортировки и хранения товара (стоимость, скорость, сохранность товара и др.)
Формы распределения товара (интенсивное, исключительное, выборочное).

Соответствие используемого набора каналов сбыта поставленным целям по охвату потребителей.
Соответствие организации сбытовой сети необходимым требованиям.
Количество сбытовых пунктов.
Возможность использования сбытовых сетей совместно с другими фирмами (в рамках стратегического альянса).
Уровень торгового обслуживания.
Соответствие форм и методов торговли задачам фирмы по стимулированию сбыта.

Параметрические спецификации позволяют учесть все пожелания клиента и создать уникальную спецификацию под индивидуальный заказ на основе уже имеющейся базовой спецификации. Для этого в них есть возможность использовать формулы, которые рассчитывают нужное количество материала и себестоимость изделия.

____________________________________________________
В ChatGPT уже запущен новый инструмент для искусственного интеллекта под названием deep research. Доступен для пользователей Pro.
Вводите промпт и ChatGPT найдет, проанализирует и синтезирует сотни онлайн-ресурсов, чтобы создать развернутый отчет за 10 минут работы, вместо нескольких часов, которые потребовались бы человеку. — Агент предоставит полный список источников, а также прокомментирует каждый из них;

Новая функция основана на новой версии OpenAI o3 model, разработанной специально для расширения возможностей просмотра веб-страниц и оптимизации анализа данных.
Программа Deep research ориентирована на профессионалов, занимающихся интенсивной интеллектуальной работой в таких областях, как финансы, наука, политика и инженерия.
Как пояснили в OpenAI, ИИ-агент был разработан с использованием сквозного обучения с подкреплением, ориентированного на сложные задачи поиска и рассуждения в различных областях.
В заявлении OpenAI говорится, что deep research agent может работать “независимо” по запросу, а “ChatGPT найдет, проанализирует и обобщит сотни онлайн-источников для создания всеобъемлющего отчета на уровне аналитика-исследователя”.
“За десятки минут можно выполнить то, на что у человека ушло бы много часов”, - добавил OpenAI.
Однако в OpenAI отметили, что глубокие исследования все еще находятся на ранней стадии и имеют определенные ограничения.
Инструмент может “иногда искажать факты в ответах или делать неверные выводы”, и “ему может быть сложно отличить достоверную информацию от слухов, и в настоящее время он демонстрирует слабость в калибровке достоверности, часто не в состоянии точно передать неопределенность”, - говорится в сообщении компании.
На начальном этапе компания внедряет эту функцию для профессиональных пользователей, позволяя выполнять до 100 запросов в месяц. Затем доступ будет предоставлен пользователям Plus и Team, а затем корпоративным клиентам.
В настоящее время deep research может извлекать информацию из открытого Интернета и загруженных файлов.
В перспективе OpenAI планирует интегрировать его со специализированными источниками данных, включая подписку и внутренние ресурсы.
_____________________________
аналог Deep Research от OpenAI.
Реализация ИИ-ресерчера, который непрерывно ищет информацию по запросу пользователя, пока система не убедится, что собрала все необходимые данные.
Для этого он использует несколько сервисов:
- SERPAPI: Для выполнения поиска в Google.
- Jina: Для получения и извлечения содержимого веб-страниц.
- OpenRouter (модель по умолчанию: anthropic/claude-3.5-haiku): Взаимодействует с LLM для генерации поисковых запросов, оценки релевантности страниц и понимания контекста.

Функции
- Итеративный цикл исследования: Система итеративно уточняет свои поисковые запросы.
- Асинхронная обработка: Поиск, парсинг веб-страниц и оценка контекста - выполняются параллельно для повышения скорости.
- Фильтрация дубликатов: Агрегирует и дедуплицирует ссылки в каждом цикле, проверяя, что одна и та же информация не будет обработана дважды.
▪️ Github (> github.com/mshumer/OpenDeepResearcher)
▪️Google Colab (>colab.research.google.com/github/mshumer/OpenDeepResearcher/blob/main/open_deep_researcher.ipynb)

Deep Research стал доступен (>chatgpt.com/) всем платным пользователям (10 запросов в месяц если у вас Plus), поэтому ловите практические советы как лучше его использовать:
— Неважно какую модель вы выбрали в ChatGPT, у Deep Research своя модель во время поиска, он проигнорируют выбор модели (UI-костыли, привет)
— Указывайте на каком языке писать отчет и на каком языке искать материалы
— Попросите его «ВАЖНО: не дублируй одну и ту же мысль много раз в тексте, если она уже описана», по умолчанию он так делает
— Deep Research не умеет смотреть на картинки — не ожидайте от него исследований где что-то нужно визуально исследовать
— Просите научные источники если хотите максимально научный отчет на фактах, можете также указать год с которого искать релевантные данные
— Поставьте приложение 11 labs — каждый такой отчет, это примерно 30-40 минут прослушивания, идеально для поездок (встроенная в ChatGPT фича глючит с длинным текстом)
— Deep Research основан на рассуждающей модели, это значит что вам все еще нужно очень детально описать, что вы хотите видеть, что не хотите, что считается банальным — иначе получите поверхностный отчет
— Deep Research имеет доступ к написанию кода, то есть он может генерировать графики, таблицы и тп тд, и включать их в финальный отчет
— Можете подсказать ключевые слова на которых стоит сделать акцент, модель же ищет в интернете и там иногда много ненужного
— Deep Research поддерживает файлы (и ссылки), можете сказать ему что в них смотреть, он может их сделать как частью контекста отчета, так и построить поиск на основе файлов (но из-за UI костылей OpenAI, сначала нужно выбрать 4o или любую модель, что поддерживает файлы на входе)
— Это все еще нейрока — ответы могут содержать ошибки и требует верификации человеком, например в тестах видел как модель делала отчет на основе картинок ПО НАЗВАНИЯМ картинок, bruh
— Это все еще лучший автономный ресечер что у нас есть, никто не может конкурировать — и Perplexity, и Google
— Deep Research не умеет смотреть за пейволл, такие статьи нужно прикладывать самим к чату

И напоследок, когда использовать Deep Research:
Когда вы начинаете исследовать какую-то тему — это быстрый и легкий способ погрузиться во что-то, дальше вы можете строить свое исследование на базе знаний из прошлых отчетов, углубляясь в тему с каждым запросом все глубже — от бизнеса до науки, пока не нашел сферу где нельзя было бы применить такой инструмент
__________________
Используйте разделители для ясности, такие как разметка, XML-теги и заголовки разделов, чтобы четко обозначить разные части входных данных, помогая модели интерпретировать различные разделы должным образом.
__________________
Как это применять на практике - смотрите с 7 минуты https://youtu.be/EauzT3Rl8Ek?list=PL1fNb3wLVqnL3OedoPKTZ-VGyfX8uVCIs&t=416

PackAudit&Consulting

В принципе, эта подтема продолжение предыдущей.
Улучшать сайты или готовить проспекты/каталоги? Важный вопрос, на который пока нет однозначного ответа.
Качественное наполнение сайта - довольно трудоемкое и затратное мероприятие. Возможно, проспекты размещенные на сайтах будут работать для чтения ИИ не хуже, а даже лучше? Сосредоточьтесь на подготовке "параметрических карточек" товара и расширенно с разными вариантами исполнений.

Из примеров
Platform V Product 360 https://platformv.sbertech.ru/products/prikladnye-produkty/product-360 — интегрированная платформа для маркетинга и автоматизированной работы с различными онлайн-каналами продаж и обмена товарными данными с внешними ИТ-системами. Благодаря AI пользователям системы больше не придётся заполнять товарные карточки вручную, в результате время на их подготовку сократится как минимум вдвое. Более того, встроенные инструменты для проверки текстов помогут уменьшить количество ошибок и повысить качество материалов. Расширенные возможности платформы позволят компаниям снизить расходы на управление контентом и каталогами продукции, отмечают разработчики.

Вернемся к теме после консультаций, надо понять тему цифровых двойников товара.

admin

Про обработку входящих запросов уже поговорили
https://lia.chat/solution
Будут и расширенные возможности для продаж.
https://llm.napoleonit.ru/ai-agent-sales-automation
Индивидуализация предложений для клиентов
Динамическое ценообразование: ИИ может помочь в установке оптимальных цен, анализируя спрос, конкуренцию и другие факторы. Для некоторых категорий товаров это может быть особенно полезно, когда нужно снизить цену при избытке или повысить при повышенном спросе.

> publish.ru/news/202509_20098045
пример: Sales Assistant, прототип, который использует Vision LLM, такие как ChatGPT, чтобы помочь клиентам визуализировать особенности дизайна, обсуждаемые с торговым представителем. Объединяя ИИ с существующими технологиями Esko, такими как Cape Pack и Phoenix, Sales Assistant позволит пользователям генерировать предложения за считанные минуты.

Активизация кросс-продаж, в т.ч. партнерских и апсейлы. Такие транзакции будут занимать меньше времени. ИИ может рекомендовать товары, которые клиенты покупают вместе или в дополнение к основному товару. Партнерские программы увеличивают средний чек, позволяя компании зарабатывать больше на каждой транзакции.

Вы сможете обрабатывать больше прямых небольших запросов, которыми раньше пренебрегали, пересылая их дистрибьютерам.

Продолжим. Посмотрите пока вот этот раздел viewforum.php?f=508

admin

Как оценить качество чат-бота? Бот с LLM vs бот на интентах по новой методологии usability-тестирования
https://habr.com/ru/companies/just_ai/articles/879370/

https://just-ai.com/platforma-jaicp эта ссылка просто пример кто делает и что предлагают

Что такое RAG?
Представьте, что нейросеть сдает экзамен. Стандартная модель (без RAG) сдает его по памяти, опираясь только на те знания, которые были в нее заложены во время первоначального обучения. Это похоже на экзамен с «закрытой книгой». Если информация в ее «памяти» устарела или неполна, ответ будет неточным.

RAG (Retrieval-Augmented Generation), что можно перевести как «генерация, дополненная извлечением», меняет правила игры. RAG в ИИ ― этот метод превращает экзамен в формат «открытой книги». Информация из авторитетного источника передается на вход модели вместе с самим запросом.

Говоря проще, RAG система — это двухступенчатый процесс:

Извлечение (Retrieval). Когда вы задаете вопрос, система сначала не генерирует ответ, а выполняет умный поиск. Она обращается к заранее определенной базе знаний (это могут быть внутренние документы компании, свежие новостные статьи, техническая документация) и находит там фрагменты текста, которые наиболее релевантны вашему запросу.
Дополненная Генерация (Augmented Generation). После того как нужная информация найдена, она передается языковой модели вместе с вашим первоначальным вопросом. По сути, нейросеть получает своеобразную «шпаргалку» с фактами. Имея на руках и ваш вопрос, и релевантный контекст из надежного источника, модель синтезирует связный, точный и подкрепленный фактами ответ.
Почему RAG важен и какие проблемы решает
Внедрение RAG моделей — это не просто техническое усовершенствование, а качественный скачок в развитии прикладного ИИ. Этот метод решает несколько фундаментальных проблем больших языковых моделей.

Устаревшие знания. Обучение гигантских моделей — процесс долгий и дорогой, поэтому их знания всегда ограничены определенной датой («knowledge cutoff date»). Они ничего не знают о событиях, произошедших после. RAG решает эту проблему, позволяя модели черпать информацию из динамически обновляемой базы данных, содержащей самые свежие сведения.
«Галлюцинации» или выдуманные факты. Иногда, не найдя точного ответа в своей памяти, нейросеть может сгенерировать ложную информацию, которая выглядит очень убедительно. RAG служит «заземляющим» механизмом. Он заставляет модель основывать свой ответ не на догадках, а на конкретных фактах, извлеченных из проверенного источника. Это радикально повышает достоверность ответов.
Отсутствие специфических знаний. Глобальная модель ничего не знает о внутренних регламентах вашей компании, технических характеристиках вашего нового продукта или деталях вашего последнего проекта. Используя RAG, вы можете «подключить» ИИ к вашей корпоративной базе знаний. В результате он превращается из эрудита общего профиля во внутреннего эксперта, способного давать точные ответы по узкоспециализированным темам.
Непрозрачность и недостаток доверия. Часто бывает непонятно, откуда ИИ взял ту или иную информацию. RAG делает процесс более прозрачным. Поскольку ответ генерируется на основе конкретных документов, система может предоставить ссылки на источники.

Таким образом, RAG не заменяет знания модели, а дополняет их актуальной и специфической информацией в реальном времени
Как работает RAG: ключевые этапы
За элегантной простотой RAG скрывается сложный, но логичный технологический процесс. Его можно разбить на два основных блока: подготовительную работу с данными и сам цикл ответа на запрос.

Блок 1: Подготовка базы знаний (индексация)
Этот этап выполняется заранее, еще до того, как пользователь задаст свой первый вопрос.

Загрузка и сегментация. Сначала система загружает все документы, которые будут служить источником знаний. Это могут быть PDF-файлы, веб-страницы, текстовые документы. Затем каждый документ разбивается на небольшие, управляемые фрагменты или «чанки». Это делается для того, чтобы поиск был более точным.
Векторизация (Создание эмбеддингов). Каждый фрагмент текста пропускается через специальную нейросеть (модель эмбеддингов), которая превращает слова и их смысл в числовой вид — вектор. Вектор — это, по сути, числовой «отпечаток» или координата смысла. Близкие по значению фрагменты текста будут иметь похожие числовые координаты.
Создание векторной базы данных. Все эти числовые векторы вместе с соответствующими им текстовыми фрагментами сохраняются в специальной векторной базе данных. Эту базу можно представить как гигантскую библиотеку, где книги (фрагменты текста) расставлены не по алфавиту, а по близости их смыслового содержания.

Блок 2: Цикл ответа на запрос
Этот процесс запускается каждый раз, когда пользователь задает вопрос.

Векторизация запроса. Вопрос пользователя также преобразуется в числовой вектор с помощью той же модели эмбеддингов.
Поиск релевантной информации. Система берет вектор запроса и ищет в векторной базе данных наиболее близкие к нему векторы документов. Это похоже на то, как навигатор находит ближайшие к вам кафе. В результате система отбирает несколько фрагментов текста из базы знаний, которые по смыслу наиболее точно соответствуют вопросу.
Формирование промпта и генерация ответа. Отобранные фрагменты текста («контекст») и первоначальный вопрос пользователя объединяются в один расширенный запрос (промпт) для большой языковой модели. Например: «Опираясь на следующий контекст: [здесь вставляются найденные фрагменты], ответь на вопрос: [здесь исходный вопрос пользователя]».
Получение финального ответа. Получив такой подробный промпт с готовыми фактами, языковая модель генерирует точный и осмысленный ответ, который основан не на ее общей памяти, а на предоставленной актуальной информации.

Примеры применения RAG в бизнесе и ИИ-решениях
Теория звучит интересно, но настоящая ценность RAG раскрывается в практических задачах. Этот метод уже активно используется для создания нового поколения интеллектуальных систем.

Корпоративные ассистенты. Представьте сотрудника, который хочет узнать детали корпоративной политики по командировкам. Вместо того чтобы искать нужный документ на внутреннем портале, он просто спрашивает чат-бота: «Каков суточный лимит на проживание в гостинице в Санкт-Петербурге?». Система с RAG мгновенно находит актуальный приказ по командировкам в базе знаний компании и дает точный ответ с указанием суммы, основываясь на внутреннем документе, а не на общей информации из интернета.
Продвинутая клиентская поддержка. Клиент сталкивается с проблемой при настройке сложного оборудования. Он заходит на сайт компании и в чате описывает свою ситуацию. RAG-система находит в базе технических руководств и инструкций именно тот раздел, который относится к его проблеме, и предоставляет четкую пошаговую инструкцию. Это снижает нагрузку на операторов поддержки и повышает удовлетворенность клиентов.
Анализ документов в юриспруденции и финансах. Юристу нужно быстро найти все упоминания определенных рисков в договоре на сотни страниц. Он может просто спросить у системы: «Какие пункты договора описывают ответственность сторон при форс-мажорных обстоятельствах?». RAG-ассистент проанализирует документ и предоставит точные выдержки из него. Точно так же финансовый аналитик может быстро получать сводку из годовых отчетов, не читая их целиком.
Образовательные платформы. Студент, готовясь к экзамену по биологии, может задать вопрос системе, подключенной к базе учебников и научных статей: «Объясни процесс фотосинтеза, используя материал из учебника для 10 класса».

Источник: Freepik. Все это похоже на сноски в научной статье: вы не просто получаете ответ, но и можете проверить, на каких данных он основан, что значительно повышает доверие к результату
Преимущества и ограничения метода RAG
Как и любая технология, RAG имеет свои сильные стороны и определенные нюансы, которые важно понимать перед внедрением.

Ключевые преимущества:

Высокая фактическая точность. Главный плюс RAG технологии — это значительное снижение риска «галлюцинаций». Поскольку ответ строится на основе конкретных данных из проверенного источника, он получается более достоверным и надежным.
Актуальность информации. Метод позволяет ИИ работать с самыми свежими данными. Достаточно просто обновить базу знаний, добавив в нее новый отчет или статью, и модель сразу сможет использовать эту информацию, без необходимости дорогостоящего и длительного переобучения.
Прозрачность и проверяемость. RAG-системы могут указывать, на какие именно фрагменты документов они опирались при формировании ответа. Это дает пользователю возможность самостоятельно проверить источник, что критически важно в таких сферах, как юриспруденция, медицина и финансы.
Экономическая эффективность. Поддерживать в актуальном состоянии относительно небольшую базу знаний гораздо дешевле и быстрее, чем регулярно переобучать гигантскую языковую модель с нуля.
Персонализация и контекстуальность. RAG позволяет легко «обучить» модель на закрытых, корпоративных данных, превращая ее во внутреннего эксперта, который знает все о ваших продуктах, клиентах и бизнес-процессах.
Ограничения и вызовы:

Зависимость от качества источника. Принцип «мусор на входе — мусор на выходе» здесь работает в полной мере. Если ваша база знаний содержит ошибки, устаревшую или противоречивую информацию, RAG-система будет генерировать такие же некачественные ответы.
Сложности на этапе извлечения. Иногда система может выбрать не самый релевантный фрагмент текста, особенно если вопрос сформулирован неоднозначно. Качество поиска напрямую влияет на качество финального ответа, и его настройка требует серьезной работы.
Техническая сложность внедрения. Построение RAG-системы — это более комплексная задача, чем простой вызов API языковой модели. Требуется настроить процессы индексации данных, развернуть векторную базу и грамотно связать все компоненты в единый конвейер.
Потенциальное увеличение времени ответа. Двухступенчатый процесс (сначала поиск, потом генерация) может занимать немного больше времени, чем прямой ответ от модели.
Система предоставит объяснение, основанное именно на рекомендованной литературе, а не на случайной статье из сети

Как начать внедрять RAG: рекомендации для бизнеса и разработчиков
Внедрение RAG — это стратегический проект, требующий совместных усилий как со стороны бизнеса, так и со стороны технических специалистов. Рекомендации для бизнеса:
Определите пилотный проект. Не пытайтесь сразу охватить все. Найдите одну конкретную и понятную бизнес-задачу, где точность и актуальность информации критически важны. Отличными кандидатами могут стать чат-бот для внутренней поддержки сотрудников или ассистент для анализа клиентских обращений.
Проведите ревизию источников знаний. Определите, где находятся ваши данные. Это внутренний портал, база инструкций, архив договоров? Оцените их качество, полноту и формат. Подумайте, какие данные нужно сделать доступными для AI в первую очередь.
Начинайте с малого и масштабируйтесь. Запустите RAG на ограниченном наборе документов для небольшой группы пользователей. Соберите обратную связь, оцените экономический эффект и только после успешного пилотного этапа планируйте расширение системы на другие отделы и процессы.

Рекомендации для разработчиков:
Выберите технологический стек. Вам понадобится несколько ключевых компонентов: языковая модель (LLM), модель для создания эмбеддингов, векторная база данных и фреймворки: инструменты вроде LangChain, n8n или LlamaIndex могут значительно упростить и ускорить процесс разработки.
Экспериментируйте с сегментацией (чанкингом). То, как вы разбиваете документы на фрагменты, сильно влияет на качество поиска. Попробуйте разные размеры чанков и стратегии их разделения (по абзацам, предложениям, с перекрытием), чтобы найти оптимальный вариант для ваших данных.
Оптимизируйте процесс извлечения. Качество поиска — сердце RAG. Тестируйте разные модели эмбеддингов и параметры поиска (например, количество возвращаемых фрагментов), чтобы добиться максимальной релевантности.
Оттачивайте финальный промпт. То, как вы формулируете итоговый запрос к LLM также имеет значение.
Пробуйте разные шаблоны промптов, чтобы получать наиболее точные и стилистически правильные ответы.

Тенденции и будущее RAG
Технология RAG не стоит на месте и активно развивается. То, что сегодня кажется передовым, завтра станет стандартом, а на смену ему придут еще более совершенные подходы. Вот несколько ключевых направлений, которые определят будущее этой технологии.

Гибридные подходы. RAG — не панацея, и в некоторых случаях его комбинируют с другими методами, в первую очередь с дообучением (fine-tuning). Представьте, что вы сначала дообучаете модель на своих данных, чтобы она «поняла» специфический стиль, терминологию и структуру ваших документов, а затем используете RAG для подгрузки конкретных фактов в реальном времени. Такой гибрид позволяет добиться и стилистической адекватности, и фактической точности.
Продвинутые методы извлечения. Простой поиск по смысловой близости — это только начало. Уже сейчас разрабатываются более сложные стратегии. Например, гибридный поиск, который комбинирует поиск по ключевым словам (как в традиционных поисковиках) и векторный поиск по смыслу. Это помогает находить релевантную информацию, даже если в запросе используются специфические термины или названия.
Агентный RAG. Следующий шаг — это RAG, управляемый автономными ИИ-агентами. Вместо того чтобы просто искать по одной базе данных, агент сможет сам принимать решения: где искать информацию? Нужно ли задать уточняющий вопрос пользователю? Стоит ли обратиться к нескольким источникам и сравнить данные? Такой «умный» RAG будет не просто искать, а проводить целое мини-расследование для ответа на сложный вопрос.
Мультимодальность. Будущее за RAG-системами, которые смогут работать не только с текстом. Представьте, что вы сможете задать вопрос по графику из годового отчета или по схеме в технической инструкции. Мультимодальный RAG будет способен «извлекать» информацию из изображений, таблиц, аудиозаписей и видео, предоставляя еще более полные и многогранные ответы.
Построение собственной RAG-системы с нуля может быть сложной задачей, требующей серьезных ресурсов и экспертизы, особенно когда речь идет о безопасности корпоративных данных. Для компаний, которые хотят получить всю мощь современных ИИ-технологий в безопасной и готовой к использованию среде, существуют профессиональные решения.

Одним из таких решений является ИИ-ассистент от Рег.облака. Это не просто чат, а целая платформа, созданная для решения реальных бизнес-задач. Вы можете использовать LLM-модели для чат-ботов, анализа данных и генерации контента, интегрируя ИИ в ключевые процессы вашей компании.

Главное преимущество платформы — безопасность. Ваш ИИ-ассистент работает в изолированном облачном сервере. Это означает, что вы можете без опасений анализировать договоры, финансовые отчеты и переписки без риска утечки в публичные сервисы. А также в ассистенте есть базовый RAG уже с возможностью создания баз знаний.

Часто задаваемые вопросы
Что такое дополненная генерация поиска простыми словами?
Простыми словами, это как если бы нейросеть перед ответом на ваш вопрос получала разрешение заглянуть в учебник или в интернет. Сначала она находит в надежном источнике самый подходящий раздел, а уже потом, прочитав его, формулирует для вас понятный и точный ответ.

Какие ограничения есть у RAG?
Главное ограничение — качество ответов напрямую зависит от качества исходной базы знаний. Если в документах есть ошибки, ИИ их повторит. Также внедрение RAG требует более сложной технической настройки по сравнению с обычным использованием языковой модели, и процесс ответа может занимать чуть больше времени.

Как RAG влияет на качество ответов LLM?
RAG кардинально повышает качество ответов. Он делает их более точными, так как они основаны на фактах из проверенных источников. Он снижает до минимума риск «галлюцинаций» (выдуманных фактов). Кроме того, ответы становятся актуальными, поскольку база знаний может обновляться хоть каждый день.

Какие преимущества RAG перед другими подходами?
По сравнению со стандартной языковой моделью, RAG дает более точные, актуальные и проверяемые ответы. По сравнению с дообучением (fine-tuning), RAG гораздо дешевле и быстрее в обновлении — не нужно переобучать всю модель, достаточно добавить новый документ в базу. Еще одно преимущество — RAG может предоставлять ссылки на источники, чего не умеет дообученная модель.

https://generation-ai.ru/media/rag

Институт упаковочного материаловедения заказчиков упаковки

Тема#3 Как поставщикам упаковки подготовиться и улучшить взаимодействие с ИИ

Нейросеть для определения категории товара и точной адресации

Как помочь ИИ полноценно работать с конкретной позицией?

Улучшать сайты или готовить проспекты/каталоги?

Преимущества обучения модели ИИ для себя

Выбор чат бота

Кто сейчас на форуме (по активности за 5 минут)