在前面的分享中,我们制作了一个天眼查 GUI 程序,今天我们在这个的基础上,继续开发新的功能,微博抓取工具,先来看下最终的效果。,
,整体的界面还是继承自上次的天眼查界面,我们直接来看相关功能。,我们整体的界面布局就是左侧可以选择不同功能,然后右侧的界面会对应改变。,创建微博 Widget,对于右侧界面的切换,我们可以为不同的功能创建不同的 Widget,当点击左侧不同功能按钮后,对应切换 Widget 即可。,我们新建一个 weibo 相关的函数,主要用来界面布局。,我们还看到整体界面有一个词云,该词云是通过 matplotlib 渲染的,所以还需要创建 matplotlib 布局。,接下来我们创建一个微博查询函数,同时因为我们这里需要实时更新抓取进度条,所以使用了多线程的方式。,而主线程与子线程之间的通信,是使用信号槽的形式。,接下来就是创建子进程函数,函数主体是爬取微博的代码。,而对于微博的具体爬取方法,这里就不再展开说明了,我是把所有微博爬虫的代码都封装好了,这里直接调用暴露的接口即可。,对于词云的制作,我们还是先通过 jieba 进行分词处理,然后使用 wordcloud 库生成词云即可。,由于很多评论当中会存在链接信息,导致制作的词云有很多高权重的英文字符,所有这里也通过正则进行了去英文字符处理。,至此,我们这个微博查询功能就完成了!
© 版权声明
文章版权归作者所有,未经允许请勿转载。