Chrome Headless 页面渲染采集

    支持使用 Chrome Headless 渲染页面及JS后,采集页面内容。

    此功能建议在 Swoole v4.5.3 正式版中使用

    配置

    @app.beans:

    [
        'ChromeDownloader'  =>  [
            'path'      =>  '', // 可执行文件路径或http接口地址
            'options'   =>  [], // 创建浏览器的参数
        ],
    ]
    Docker 下使用建议 path 填 http 接口地址,即:http://{host}:{port}/json

    注解

    @Downloader 注解中,指定 classChromeDownloader

    @ChromeNavigation

    Chrome 导航注解

    类名:\Yurun\Crawler\Module\Downloader\Annotation\ChromeNavigation

    参数:

    名称描述默认值
    eventName等待事件名称(DOMContentLoaded/load/networkIdle)load
    timeout超时时间,单位:毫秒30000

    安装

    Docker

    docker pull alpeware/chrome-headless-trunk
    docker run -d -p 9222:9222 alpeware/chrome-headless-trunk

    apt

    apt install chromium-browser