z009+java视觉元素网页信息提取sqlserver(300元)

  • 模板:¥300.00
  • 成品编号:zyy-z009
  • 使用技术:
  • 数据库:Sqlserver
  • 最后更新:2018-09-19 12:18

注意:QQ1764030875,qq1834660615为本网站唯一成品的账号,其他均为盗版

z009+java视觉元素网页信息提取sqlserver(300元)的大图展示

计算机毕业设计源码网:我们提供的源码通过邮箱或者QQ传送,如果有啥问题直接联系客服


素材描述:本套设计包含程序,演示视频

本套设计要实现的功能如下:

         页面的基于视觉的内容结构是结合DOM树以及一些视觉提示信息而得到的。它具有三个步骤:页面块提取、分隔条提取以及语义块重构。这三个步骤联合一起作为一次语义块检测的完整步骤。Web页面首先被分割为几次比较大的语义块,同时这几个语义块所组成的层次结构将被记录下来。对于检测出来的每一个大的语义块分页过程又可以继续进行,直到语义块的DoC值达到预先设定的PdoC为止。在每次迭代循环中,当前逻辑块的DOM树结构以及它的视觉信息都将被获取。语义块提取的目标是提取出当前子页面中所包含的所有的可视语义块。在VIPS中,一个可视的分隔条可以用二维向量(Ps,Pe)描述,其中,Ps是分隔条的起始坐标,而Pe则是分隔条的终止坐标。坐标的单位全部为像素pixel。当页面块最终合并成为语义块之后,本轮的迭代也就结束了。对于这些语义块,每一个语义块的DoC都会与PdoC进行对比,如果DoC的值小于PdoC,那么新的迭代过程将重新开始:页面块检测,分隔条检测以及内容结构重构。当所有的语义块的DoC的值都不大于PdoC,迭代过程将停止。同时针对整个Web页面的内容结构将构建出来。

全部评论 / 0

    相关推荐

    收缩