【PYTHON】实时爬取猫眼票房+微信推送

admin 2025年1月11日12:17:09评论2 views字数 1512阅读5分2秒阅读模式

0x00 前言

写了个爬i春秋的文章跟这篇大同小异,我就不发博客了i春秋监控文章回帖数+评论→微信推送
今天写的是作业3——实时的对本次春节档的电影票房进行爬取,然后我加了个推送到微信功能,这样我们可以在微信上实时监控。
本篇程序所利用的库如下:

import requests,json,schedule,time
from lxml import etree

0x01 正文

【PYTHON】实时爬取猫眼票房+微信推送

打开过这个地址的bro一定会发现,综合票房的数据进行了反爬虫处理,如果想要绕过限制还需要下载该网站匹配字体等系列操作进行绕过。(还挺麻烦)
我辈弟子怎能轻言放弃?【PYTHON】实时爬取猫眼票房+微信推送

不得不说,猫眼的程序员,放松了警惕。以为大家都在专业版晃悠??(确实,一堆人晃悠)
咱直接打开http://piaofang.maoyan.com/box-office?ver=normal这个地址。便会发现,好家伙。这里没有半点加密。

【PYTHON】实时爬取猫眼票房+微信推送

那还说啥,直接爬就完事了。这里我们依旧用到了XPATH的定位方法。效率贼高!不会用的朋友,请看一下上一篇文章。
【PYTHON】实时爬取猫眼票房+微信推送

好的。现在这里我们的电影+实时票房已经成功爬取了。
那么现在我们需要把他们给对应起来并保存。我们该怎么做呢?
是,俩个循环嵌套?不是,这样是一对多的关系。我们必须将循环同时进行。且,这里我们需要利用zip函数
for i,ii in zip(name, pf):
【PYTHON】实时爬取猫眼票房+微信推送

【PYTHON】实时爬取猫眼票房+微信推送

【PYTHON】实时爬取猫眼票房+微信推送

成功保存。这样我们这里的第一部分功能实现了。现在来做第二个功能推送到微信消息。在做这个消息之前,我们需要注册一个企业微信。(信息随便填,不是让你注册企业)
注册成功后,点 管理企业 进入管理界面,然后选择应用管理 → 应用 → 创建应用【PYTHON】实时爬取猫眼票房+微信推送

【PYTHON】实时爬取猫眼票房+微信推送

AgentId,Secret后面要用。
然后点击我的 我的企业可以看到企业ID
【PYTHON】实时爬取猫眼票房+微信推送

OK,然后在下面这个连接输入信息并访问。用来获取access_token
https://qyapi.weixin.qq.com/cgi-bin/gettoken?corpid=填AgentId&corpsecret=填Secret
【PYTHON】实时爬取猫眼票房+微信推送

现在我们需要提取access_token。(他是动态变化的)
【PYTHON】实时爬取猫眼票房+微信推送

r = json.loads(r)#将json格式数据转换为字典

接下来我们就需要post卡片消息到微信的接口

{
    "touser" : ["userid1","userid2","CorpId1/userid1","CorpId2/userid2"],
    "toparty" : ["partyid1","partyid2","LinkedId1/partyid1","LinkedId2/partyid2"],
    "totag" : ["tagid1","tagid2"],
    "toall" : 0,
   "msgtype" : "textcard",
   "agentid" : 1,
   "textcard" : {
            "title" : "领奖通知",
            "description" : "<div class=\"gray\">2016年9月26日</div> <div class=\"normal\">恭喜你抽中iPhone 7一台,领奖码:xxxx</div><div class=\"highlight\">请于2016年10月10日前联系行政同事领取</div>",
            "url" : "URL",
            "btntxt":"更多"
   }
}

结果如图
【PYTHON】实时爬取猫眼票房+微信推送

【PYTHON】实时爬取猫眼票房+微信推送

接下来我们对于俩个功能进行封装。(文件上传到github。觉得还行的xd点波STAR谢谢!)
对了。我们还需要一个定时功能,就用到了schedule函数
【PYTHON】实时爬取猫眼票房+微信推送

最后成效如下【PYTHON】实时爬取猫眼票房+微信推送

【PYTHON】实时爬取猫眼票房+微信推送

0x03 文末

python的功能还是十分强大,哈哈!有什么想法,可以在下面留言一起探讨~~~~

参考资料

我的github项目地址
猫眼实时票房
企业微信官网
企业微信api

©著作权归作者所有 - source: 535yx.cn

免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉。
  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2025年1月11日12:17:09
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   【PYTHON】实时爬取猫眼票房+微信推送http://cn-sec.com/archives/3619315.html
                  免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉.

发表评论

匿名网友 填写信息