CÁC PHƯƠNG PHÁP ÁNH XẠ THUỘC TÍNH HỘP THÔNG TIN WIKIPEDIA ĐẾN WIKIDATA

Tạ Hoàng Thắng

Tóm tắt


Wikidata là một cơ sở dữ liệu trực tuyến mở lưu trữ các tài nguyên chung của các dự án liên quan do tổ chức Wikimedia quản lý. Việc đồng nhất hóa các hộp thông tin (infobox) của Wikipedia được nêu trong kế hoạch giai đoạn 2 của Wikidata. Theo đó, các hộp thông tin sẽ được đồng nhất hóa để tránh tình trạng đa dạng dữ liệu giữa các dự án ngôn ngữ. Đồng thời, nhóm phát triển Wikidata cũng lên kế hoạch phát triển hệ thống tự động diễn dịch các thuộc tính của các hộp thông tin Wikipedia. Bài báo này nhắm đến việc đưa ra một vài phương pháp tiếp cận để ánh xạ các thuộc tính của hộp thông tin đến Wikidata, từ đó nâng cao khả năng phát triển làm giàu nội dung cho các bài viết Wikipedia. Chúng tôi tập trung chủ yếu vào việc ánh xạ các thuộc tính ở Wikipedia Tiếng Việt và Wikipedia Tiếng Anh.

Từ khóa


DBPedia; Infobox Property; Mapping; Wikidata; Wikipedia.

Toàn văn:

PDF

Các tài liệu tham khảo


Vrandečić, D., & Krötzsch, M. Wikidata: a free collaborative knowledgebase. Communications of the ACM, 57(10), 78-85. (2014).

Erxleben, F., Günther, M., Krötzsch, M., Mendez, J., & Vrandečić, D. . Introducing Wikidata to the linked data web. In The Semantic Web–ISWC 2014 (pp. 50-65). Springer International Publishing. (2014).

Ta, T. H., & Anutariya, C. A Model for Enriching Multilingual Wikipedias Using Infobox and Wikidata Property Alignment. In Semantic Technology (pp. 335-350). Springer International Publishing. (2014).

Lehmann, J., Isele, R., Jakob, M., Jentzsch, A., Kontokostas, D., Mendes, P. N., ... & Bizer, C.. DBpedia–A large-scale, multilingual knowledge base extracted from Wikipedia. Semantic Web. (2014).

Aprosio, A. P., Giuliano, C., & Lavelli, A.. Automatic Mapping of Wikipedia Templates for Fast Deployment of Localised DBpedia Datasets. In Proceedings of the 13th International Conference on Knowledge Management and Knowledge Technologies (p. 1). ACM. (2013)

Bizer, C., Lehmann, J., Kobilarov, G., Auer, S., Becker, C., Cyganiak, R., & Hellmann, S. DBpedia-A crystallization point for the Web of Data. Web Semantics: science, services and agents on the world wide web, 7(3), 154-165. (2009).

Thanh Nguyen, Viviane Moreira, Huong Nguyen, Hoa Nguyen and Juliana Freire. Multilingual schema matching for Wikipedia infoboxes. Proceedings of the VLDB En-dowment, Volume 5 Issue 2, October 2011, Pages 133-144, (2011).

Eytan Adar, Michael Skinner and Daniel S. Weld. Information Arbitrage Across Multi-lingual Wikipedia. WSDM '09 Proceedings of the Second ACM International Con-ference on Web Search and Data Mining. Pages 94-103, (2009).

Navigli, R., & Ponzetto, S. P.. BabelNet: Building a very large multilingual semantic network. In Proceedings of the 48th annual meeting of the association for compu-tational linguistics (pp. 216-225). Association for Computational Linguistics. (2010, July)

Bouma, G., Duarte, S., & Islam, Z. Cross-lingual alignment and completion of Wikipedia templates. In Proceedings of the Third International Workshop on Cross Lingual Information Access: Addressing the Information Need of Multilingual Societies (pp. 21-29). Association for Computational Linguistics. (2009, June).

Wu, F., & Weld, D. S.. Automatically refining the wikipedia infobox ontology. In Proceedings of the 17th international conference on World Wide Web (pp. 635-644). ACM. (2008, April)

Schulze, B. M. U.S. Patent No. 6,167,369. Washington, DC: U.S. Patent and Trademark Office. (2000).

Schmitt, J. C. U.S. Patent No. 5,062,143. Washington, DC: U.S. Patent and Trademark Office. (1991).

Vietnamese Wordnet. (n.d.). Retrieved April 04, (2016), from http://viet.word-net.vn/wnms
DOI: http://dx.doi.org/10.37569/DalatUniversity.6.2.41(2016)

Các bài báo tham chiếu

  • Hiện tại không có bài báo tham chiếu.


Copyright (c) 2016 Tạ Hoàng Thắng

Creative Commons License
Công trình này được cấp phép theo Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
Văn phòng Tạp chí Đại học Đà Lạt
Nhà A25 - Số 1 Phù Đổng Thiên Vương, Đà Lạt, Lâm Đồng
Email: tapchikhoahoc@dlu.edu.vn - Điện thoại: (+84) 263 3 555 131

Creative Commons License
Trên nền tảng Open Journal Systems
Thực hiện bởi Khoa Công nghệ Thông tin