Document
检索banner
高级检索 在检索结果中检索
全部字段 题名 作者 关键词 摘要

基于DOM修剪的藏文Web信息提取

  • 【获取途径】 超星期刊网
  • 【作者】珠杰,欧珠,格桑多吉
  • 【作者单位】西藏大学计算机科学与技术系  拉萨  (850000)
  • 【年份】2008
  • 【卷号】第24期
  • 【页码】58
  • 【ISSN】1000-3428
  • 【关键词】音节点 DOM树 藏文 Web信息提取 
  • 【摘要】 随着互联网的普及和藏文信息技术的不断发展,出现了大量的藏文网站。该文根据藏文音节点的特征识别藏文网页并进行抓取。在建立DOM树的基础上,分析网页的链接、非链接文本与主题信息块之间的相关度。通过语义修剪算法提取藏文主题信息。经测试证实,该算法在藏文网页识别和藏文主题信息提取中具有较好的适应性。
  • 【基金】国家自然科学基金
  • 【文献类型】 期刊
进入发现系统查看更多信息
相同单位的文献

发文期刊《基于DOM修剪的藏文Web信息提取》历年引证文献趋势图

引证的图书列表

共2条记录 1/1 第一页 [1] 下一页 最后一页 到第

引证的期刊论文等列表

共20条记录 1/2 第一页 [1] [2] 下一页 最后一页 到第
页脚