1.openinnewtab,在新的标签页打开,没有下载文件的按钮,即使选择打印、另存为pdf,最后存下来的文件也是空白的。
2.找到pdf的后台存储路径但是不能直接访问,因为有权限限制,报错401。
3.使用了Java代码读取url下载,但是下载下来的pdf文件不能打开,显示文件已损坏。
4.使用Google-pdf-downloader工具,但是下载下来的PDF_DataFile文件是空的(因为文件大小显示为0,大概率就是空的)。
哪位大神有办法下载?或者其他效率比较高的方法能实现近似目标也行,谢谢!!
江户川闰土
开F12,看pdf加载的那个状态码是206的请求,带上所有header拷贝出来,有一个header是-H'range:bytes=xxx-xxx',直接把这header删了,就行了
-H'accept:*/*'\
-H'accept-language:zh-CN,zh;q=0.9,en;q=0.8,zh-TW;q=0.7'\
-H'cache-control:no-cache'\
-H'pragma:no-cache'\
-H'priority:u=1,i'\
-H'sec-ch-ua:"GoogleChrome";v="125","Chromium";v="125","Not.A/Brand";v="24"'\
-H'sec-ch-ua-mobile:0'\
-H'sec-ch-ua-platform:"Windows"'\
-H'sec-fetch-dest:empty'\
-H'sec-fetch-mode:cors'\
-H'sec-fetch-site:cross-site'\
-H'user-agent:xxx'\
-H'x-nd-auth:xxxx"'
huoyun(buliangshuai)在ta的帖子中提到:
……
lxgxy?要走了吗?——“嗯”——
哈哈lxgxy,幸亏我没吃仲裁,要是你连任了,我又吃了仲裁,我这不毁了你一辈子吗
要走了吗?以后还能再见到吗?下次见面的时候你要幸福!你要开心你要幸福,好不好?
lxgxy你要开心要幸福啊!你的世界没有我了没关系,但你要开心,要幸福
lxgxy!!lxgxy!!呜……呜啊啊啊lxgxylxgxy没有你我活不了啊我可以为你去怼水n我可以为你直面所有仲裁但我不能没有你啊lxgxy!lxgxy!
♀♀♀啊啊啊啊lxgxy你带我走吧lxgxy
AAAA搬砖老张
这就是计算机学院的大神吗
yzs(江户川闰土)在ta的帖子中提到:
谢谢同学!你提供了一个新的思路!我刚才试了几遍,不过有报错的情况。一开始解析不了域名,我把域名换成了真实的IP地址,user-agent和x-nd-Auth值也从浏览器里面copy出来粘贴上了。修改后的命令如下:
我在Windows的cmd里面执行,报错信息包括:
curl:(3)URLrejected:Portnumberwasnotadecimalnumberbetween0and65535
curl:(3)URLrejected:Badhostname
curl:(3)URLrejected:NohostpartintheURL
curl:(6)Couldnotresolvehost:Mozilla
curl:(6)Couldnotresolvehost:NT
在Linux上执行的时候,我把sec-ch-ua-platform:"Windows"改成了sec-ch-ua-platform:"Linux",不过报错curl:(6)Couldnotresolvehost:;未知的错误
不知道你那里是否可以真实下载下来,并成功打开pdf文件?
我的命令是linux的,要是windows可以在导出的时候选cmd而不是bash,这个可以直接跑的,解析不了域名应该是别的问题
文件名:test.pdf
有效期限:2024-07-3114:43
同学好,谢谢你的耐心解答,还给出了pdf文件,很厉害!我想再细问下哈,
1.你完整执行的命令和最开始发出来的一样吗?比如:域名你有没有做修改,或者有没有别的映射?user-agent和x-nd-auth值不是xxx吧?
2.你的linux环境是服务器还是什么?我的Linux环境是在阿里云服务器,但是ping命令行里面的域名实际上都能ping通。