过早客
  • 首页
  • 节点
  • 成员
  • 广告投放
  • 登录
  • 注册

这种网页背后是基于什么技术

IT技术 • tornado • 发表于 6 年前 • 最后回复来自 coder_1 • 6 年前

前端小白一枚,我理解的网页前端技术就是html写页面框架、css负责样式、js负责交互行为,比如这种:
view-source:http://www.qq.com/

但是现在看到越来越多的网页是类似这样的:
view-source:http://www.toutiao.com/

基本上没有html、css,全是js来完成。我猜想这种最终应该也会是html+css+js,只是html、css是js动态加载下来的,不知道理解对不对,那对于我爬取这个页面来讲,有没有什么办法获取到最终的html文档呢?毕竟是要抽取出网页的内容。

加入收藏 新浪微博 分享到微信 ❤赞 2216 次点击 0 人赞 0 人收藏

打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮

共收到6条回复
xiaohao750 6 年前 #1 赞 0

抓动态网页的内容两种办法,要么用爬虫的语言实现的js引擎内部渲染一下Dom在解析,Java有Nashorn,Python有PhantomJS等,要么调用外部浏览器渲染,例如selenium

plax 6 年前 #2 赞 1

直接找接口,伪造请求抓数据吧

alex_sc 6 年前 #3 赞 0

spa了解一下?

alex_sc 6 年前 #4 赞 0

https://github.com/jerryni/blog/issues/4

cuzfinal 6 年前 #5 赞 0

前端3大框架了解一下,angular、react、vue

coder_1 6 年前 #6 赞 0

spa。要爬的话。伪造行为。等渲染dom再分析。

请绑定手机号后,再发言,点击此处
Guozaoke.com—源自武汉的高端交流分享社区
相关主题
华为NOVA14系列的芯片性能终于站起来了
社区里有没有对钢架自行车和钢架builder感兴趣的同志
Android手机推荐
社友们,车险异地投保有了解的吗
为什么手机没有把投影仪这个市场给兼并了呢?
最近时间少了, 隔了这么久, 才做了一个网站
华为麒麟X90用5nm工艺
开发了一个管理 Linux 服务器的桌面可视化管理工具,求蹂躏
服务器可视化采用纯前端渲染,这个技术实现难度如何
做了一款摸鱼软件,有人要试用吗?

过早客微信公众号:guozaoke • 过早客新浪微博:@过早客 • 广告投放合作微信:fullygroup50 鄂ICP备2021016276号-2 • 鄂公网安备42018502001446号