《前端算法实战》使用解释器模式实现Xpath路径的算法

网站建设3年前发布
42 0 0
20230306095230e87743c25cec5a73b14584ae2c8623033977fe863, 定义听起来可能比较抽象,举个例子比如我们常见的网站多语言,要实现多语言我们首先要预定语言的类型,提前设计不同语言的语料库,然后我们会根据配置和统一的变量规则来映射到不同语言。,那么如何快速获取元素的Xpath路径呢?其实也很简单,我们打开谷歌调试工具:,202303060103193852ebf22e7288953020750cc3a5a0e5ed3ab7213,选中Copy XPath即可复制元素的Xpath路径。格式可能长这样:,获取元素Xpath路径的应用场景很多,比如我们经常使用的python爬虫,利用爬虫框架可以通过Xpath路径很方便额控制页面中的某个dom节点,进而获取想要的数据和元素;又比如我们通过发送元素的Xpath路径给后端,后端可以统计某一功能的使用情况和交互数据;又比如分析用户在网站中浏览的热力分布图,路径画像等等。,在实现之前,首先我们分析一下Xpath路径的结构,比如我们有一个页面,元素span的结构如下:,那么我们的Xpath路径可能长这样:, 从上面可以看出,我们的最右边一个元素都是目标元素,而最左边第一个元素都是最外层容器。要完成这个过程首先我们要通过元素的parentNode来获取当前元素的父元素,直到找到最顶层位置。但我们还需要注意的一点是,每找到上一层我们还要遍历该元素前面的兄弟元素previousSibling,如果这个兄弟元素名字和它后面的元素名字相同,则在元素名上+1., 第一步我们先实现一个遍历同级兄弟元素的方法getSameLevelName:,第二步,遍历文档树。,有了这两个方法,我们就可以轻松获取元素的XPath路径啦,比如:,这样会返回开篇的一样的数据结构了.如:HTML/BODY|HEAD/DIV/SPAN。,本文转载自微信公众号「趣谈前端」,可以通过以下二维码关注。转载本文请联系趣谈前端公众号。,20230306010346d174590851fb3815ea709254792783e1e96fe2212
© 版权声明

相关文章