浏览器环境模拟之pjstealth

admin 2023年11月19日19:59:24评论75 views字数 859阅读2分51秒阅读模式

简介

之前对pjstealth的使用做了简单的介绍,而本次对pjstealth进行了一些更新,在此做一下记录。

在之前的版本中,使用pjstealth打开https://web.uutool.cn/网址之后,通过刷新每次都可以得到一个新的指纹,但是在使用中碰到了一些问题问题:

  1. 如果我们通过浏览器进行抓取,每次都会访问新的页面,但是每个页面呢都有指纹的检测(例如pdd,定时发送环境指纹),那么我们每次变换的指纹反而使我们每次都会被识别到,这样反而不利于我们的爬取
  1. 之前的pjstealth只支持macos环境,导致windows无法使用
  2. 之前pjstealth关于webglinfo没有进行关联,比如mac有m1,有intel,那么他的user-agent会有所不同,以及webgl的信息也会有所不同

此次的更新,主要对以上的问题点进行了一些解决。主要是针对于第一点,做到浏览器每次启动都是唯一的一个指纹,只有在重新启东时,才会更改

使用


import time

from playwright.sync_api import sync_playwright
from pjstealth import stealth_sync

p = sync_playwright().start()
proxy = {
    "server": "127.0.0.1:7890"
}
browser = p.chromium.launch(headless=False)

page = browser.new_page(
    user_agent='Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36',
    proxy=proxy)
stealth_sync(page)

page.goto("https://web.uutool.cn/")
time.sleep(10000)

原文始发于微信公众号(诗和远方和田野):浏览器环境模拟之pjstealth

  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2023年11月19日19:59:24
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   浏览器环境模拟之pjstealthhttp://cn-sec.com/archives/2220320.html

发表评论

匿名网友 填写信息