火车头采集器采集梨视频

  • 内容
  • 相关
准备工作

下载火车头采集器(7.6破解版),百度一下就有

《火车头采集器7.6破解版闪退解决办法》

再看本文之前需要有火车头采集器使用基础

分析目标站点

以“搞笑”为例(http://www.pearvideo.com/category_7)

1、列表、分页

由于目标站点和一般的站点的分页方式不一样,使用Google、或者其他浏览找到分页方式

pearvideo1.png

http://www.pearvideo.com/category_loading.jsp?reqType=5&categoryId=7&start=24&mrd=0.8454637756481935&hotContIds=1216256,1215984,1216367
http://www.pearvideo.com/category_loading.jsp?reqType=5&categoryId=7&start=36&mrd=0.8454637756481935&hotContIds=1216256,1215984,1216367

通过上面链接分析得到,每次分页只有红色数字部分改变。

访问上面的网址得到如下页面,我们采集这个页面就可以了

pearvideo2.png

2、分析视频源地址

打开一篇文章,查看源代码可以找出视频相关地址

pearvideo3.png

写采集规则

通过上面的对目标网站分析之后,采集规则就很好写了。

1、采集网址规则

第一页的链接为0,不是1

公差为12(不明白的看上面链接分析)

pearvideo4.png

2、多级网址获取

关系:列表网址–>文章网址–>视频地址

在第1步的时候已经填写了列表网址,这里只要采集文章和视频地址就可以了


pearvideo5.png
pearvideo6.png


在写脚本规则之前把采集内容规则里自带的删除掉

pearvideo7.png

脚本规则:


<li class="categoryem">
<div class="vervideo-bd">
<a href="[参数]" class="vervideo-lilink actplay">
(*)
</a>
<div class="vervideo-title">[标签:标题]</div>
(*)class="column">[标签:作者]</a>
<div class="actcont-auto">
<span class="fav" (*) </li>
原网页源代码:
<li class="categoryem">
<div class="vervideo-bd">
<a href="video_1216735" class="vervideo-lilink actplay">
<div class="vervideo-img" >
<div class="verimg-view"><div class="img" style="background-image: url(http://image1.pearvideo.com/main/20171206/10483457-113726-0.png);"></div></div>
<div class="cm-duration">00:49</div> </div> <div class="vervideo-title">跟女朋友从宾馆出来千万别做这件事</div> </a>
</li>
<div class="actcont-auto"> <a href="column_839" class="column">段子哥</a> <span class="fav" data-id="1216735">0</span> </div>
</div>
再添加一个视频地址获取规则:
<script type="text/javascript">var contId="(*)",liveStatusUrl="liveStatus.jsp",liveSta="",playSta="1",autoPlay=!1,isLiving=!1,isVrVideo=!1,hdflvUrl="",sdflvUrl="",hdUrl="",sdUrl="",ldUrl="",srcUrl="[标签:视频地址]",vdoUrl=srcUrl,skinRes="//www.pearvideo.com/domain/skin",videoCDN="//video.pearvideo.com";</script>
原网页源代码:
<script type="text/javascript">var contId="1216821",liveStatusUrl="liveStatus.jsp",liveSta="",playSta="1",autoPlay=!1,isLiving=!1,isVrVideo=!1,hdflvUrl="",sdflvUrl="",hdUrl="",sdUrl="",ldUrl="",srcUrl="http://video.pearvideo.com/mp4/third/20171206/10343957_130140-hd.mp4",vdoUrl=srcUrl,skinRes="//www.pearvideo.com/domain/skin",videoCDN="//video.pearvideo.com";</script>

测试采集结果

pearvideo8.png

火车头采集器采集梨视频
         本页正文内容约3066个文字
         本文标签:

         版权声明:若无特殊注明,本文皆为“懒人的小窝”原创,转载请保留文章出处。

         本文链接:https://suppore.cn/700.html   百度已收录

发表评论

电子邮件地址不会被公开, 推荐使用QQ快速评论!

评论

12条评论
  1. avatar

    梁兴健 Lv.2 Chrome 64.0.3282.119 Chrome 64.0.3282.119 Windows 7 x64 Edition Windows 7 x64 Edition 回复

    表情 骚年,我怀疑你写了一篇假的文章!

    广东省广州市 电信

    1. avatar

      钟水洲博客 Lv.1 Chrome 63.0.3239.132 Chrome 63.0.3239.132 Windows Windows 回复

      拜个早年

      江西省南昌市 联通

      1. avatar

        像晚约 Lv.1 Chrome 55.0.2883.87 Chrome 55.0.2883.87 Windows Windows 回复

        06ce95f6829ad732c4816c3431e371e1崩溃

        天津市 电信

        1. avatar

          猫少 Lv.1 Internet Explorer 11.0 Internet Explorer 11.0 Windows 7 x64 Edition Windows 7 x64 Edition 回复

          猫少博客 www.qq2s.cn,欢迎友联

          云南省昆明市 电信

          1. avatar

            凤凰娱乐平台 Lv.1 Chrome 55.0.2883.87 Chrome 55.0.2883.87 Windows 7 x64 Edition Windows 7 x64 Edition 回复

            世上最凄绝的距离是两个人本来距离很远,互不相识,忽然有一天,他们相识,相爱,距离变得很近。然后有一天,不再相爱了,本来很近的两个人,变得很远,甚至比以前更远。

            安徽省淮北市 电信

            1. avatar

              私彩平台 Lv.1 Chrome 55.0.2883.87 Chrome 55.0.2883.87 Windows 7 x64 Edition Windows 7 x64 Edition 回复

              生命中,不断地有人离开或进入。于是,观见的,看不见的;记住的,遗忘了。生命中,不断地有得到和失落。于是,看不见的,看见了;遗忘的,记住了。然而,看不见的,是不是就等于不存在?记住的,是不空间里的好文章是永远不会消失?

              安徽省淮北市 电信

              1. avatar

                时时彩平台 Lv.1 Chrome 55.0.2883.87 Chrome 55.0.2883.87 Windows 7 x64 Edition Windows 7 x64 Edition 回复

                几丛骆驼刺好像没了颜色般的呼吸,却吸入了一缕一缕风沙。这是他们生命中的娱乐方式,没有什么比这更快乐,因为,他们知道,最寂寞的是空虚。所以,他们选择了接受。

                安徽省淮北市 电信

                1. avatar

                  美词创意设计 Lv.1 Chrome 55.0.2883.87 Chrome 55.0.2883.87 Windows XP Windows XP 回复

                  好东西还是要支持一下!

                  广东省 电信

                  00:00 / 00:00
                  顺序播放