Първи етапен доклад с текущия вид на алгоритмите по Дейност 6 "Изследване и създаване алгоритми за извличане на критерии от лексикални спектри на документи"

8 юли 2013 г.

"В края на месец юли 2013 г. по график приключи Етап 1 от Дейност 6  "Изследване и създаване алгоритми за извличане на критерии от лексикални спектри на документи".

Основната цел на този етап от изследването беше да се създадат алгоритми, които да извеждат лексикални спектри на базата на създадените структури данни и класификатори, позволяващи по-нататъшна количествена оценка на ефективността на извличане на критерии чрез сравняване на действията на експерт върху тестово множество документи с действията на алгоритъма му върху същото множество.

След проведените тестове беше установено, че средствата на алгоритъма са силно зависещи от наличните класификации. При доминация в броя обекти от една или няколко класификации, тези класификации се идентифицират като общи, а всички останали биват добавяни като отличителни и игнорирани. Ако контекстът на търсенето не съвпада с доминиращите класификации, алгоритъмът става силно неефективен.

Екипът заключи, че за да се използва алгоритъмът като вход на критерии за търсене, трябва да се предостави възможност на потребителя за контрол над предлаганите критерии в няколко насоки.

Свойствата на алгоритъма, наблюдавани при тестовете, го правят подходящ за анализ на информация за дефинирани периоди от време. Например за проверка коя е най-доминиращата класификация за примерен обект в множеството на входящите в приложението обекти за последния час.

Докладът от проведените изследвания ще може да бъде намерен в публичната база данни с резултати, предвидена в проекта."

За повече информация по проекта може да се свържете с Анелия Добрева, тел. 02/958-95-16

                                          
ЛАМЕЛ ООД
104 бул. "Иван Гешов". София 1612 България

Телефон за контакт: (+3592) 9589516;(+3592) 9588475

office@lamelsoft.com

Работно време с клиенти 11.00h - 18.00h GMT + 2