Автоматическое обогащение неформальной онтологии на основе текстов определенной предметной области
Н. Астраханцев,
Институт системного программирования РАН,
astrakhantsev@ispras.ru
Концептуализация знаний, необходимых для эффективной обработки текстовой информации, как правило, представляется в виде онтологий. В зависимости от предметной области и решаемых задач, создаются разные виды онтологий: формальные, включающие в себя подробные отношения между концептами и аксиомы; таксономии, представляющие собой иерархически организованные концепты; неформальные онтологии, например интернет-энциклопедии, которые создаются и поддерживаются сообществом пользователей. Создание онтологий вручную - трудоемкий и дорогостоящий процесс, требующий участия экспертов, поэтому за последние годы было разработано множество систем, в той или иной степени автоматизирующих этот процесс.
В докладе предлагается краткий обзор методов автоматического построения и обогащения онтологий, а также рассматривается система, разрабатываемая в Институте системного программирования РАН и предназначенная для автоматического обогащения неформальной онтологии на основе коллекции текстовых документов определенной предметной области.
Презентация в формате PDF: astrahantsev20130328.pdf.
Литература:
- Н.А. Астраханцев, Д.Ю. Турдаков. Методы автоматического построения и обогащения неформальных онтологий //Программирование. 2013. Т.39, №1, с. 23-34.
- C. Biemann. Ontology Learning from Text: A Survey of Methods. LDV Forum, vol. 20, pp. 75-93, 2005.
- T.R. Gruber. Towards principles for the design of ontologies used for knowledge sharing. International Journal of Human-Computer Studies, vol. 43, pp. 907–928, 1995.
- A. Faatz, S. Hörmann, C. Seeberg, and R. Steinmetz. Conceptual enrichment of ontologies by means of a generic and configurable approach. In Proceedings of the ESSLLI 2001 Workshop on Semantic Knowledge Acqusition and Categorisation, 2001.
- P. Buitelaar, P. Cimiano, and B. Magnini. Ontology Learning from Text: Methods, Evaluation And Applications, ser. Frontiers in Artificial Intelligence and Applications. IOS Press, 2005.
- M. Pazienza, M. Pennacchiotti, and F. Zanzotto. Terminology extraction: An analysis of linguistic and statistical approaches. In Knowledge Mining, ser. Studies in Fuzziness and Soft Computing, S. Sirmakessis, Ed. Springer Berlin /Heidelberg, vol. 185, pp. 255–279, 2005.
- G. Nenadié, S. Ananiadou, and J. McNaught. Enhancing automatic term recognition through recognition of variation. In Proceedings of the 20th international conference on Computational Linguistics, ser. COLING ’04. Stroudsburg, PA, USA: Association for Computational Linguistics, 2004.
- Д.Ю. Турдаков. Методы разрешения лексической многозначности //Программирование. 2010. Т. 36, № 8, с. 3–27.
- M. Neshati, H. Abolhassani, and A. Rahimi. Taxonomy learning using compound similarity measure. In The 2007 IEEE/WIC/ACM International Joint Conference on Web Intelligence, 2007.
- Andreas Faatz and Ralf Steinmetz. Ontology Enrichment with Texts from the WWW. In Semantic Web Mining, 2002.
|