Перед началом предиктивного кодирования эксперты самостоятельно производят обработку небольшого набора документов с разным уровнем полезности.
Затем, на основе отобранного, алгоритмы, которые используются программным обеспечением проходят самообучение.
Программа анализирует алгоритмы по заданным параметрам и создает математическую модель.
Как происходит ПК? Данный процесс начинается с того, что первый результат итерации рассматривает человек.
Человек указывает где, в какой степени и какие документы полностью соответствуют поставленной ранее задаче. После чего все повторяется снова.
Программа вновь ищет по учебному набору, но только уже с уточненными ранее параметрами.
Результат опять проверяется и цикл повторяется до тех пор, пока алгоритмы не научатся со значительной степенью точности определять необходимые документы.
Только после проделанной работы происходит запуск поиска по всему набору документов.
Данную методику можно перенести на всем известную поговорку — искать иголку в стоге сена.
Только здесь сначала необходимо как можно более точно описать ту самую иголку для компьютера, а затем он быстро переберет весь стог по одной соломинке.
Главным отличием данной технологии от всех предыдущих — это ее способность адаптироваться.
Общепринятая технология основана на поиске по ключевым словам, что сокращает объем и качество найденного. ПК рассматривает:
Читайте продолжение во второй части статьи о работе предиктивного кодирования