SharePoint 如何搜索爬网第三方网站设置|雨林木风下载站

SharePoint发行版本有SharePoint2003、SharePoint2007、Sharepoint 2010、SharePoint2013和SharePoint2016。SharePoint提供了功能强大的团队协作环境，使得组织能够在整个组织内部实现整合、组织、查找和提供 SharePoint站点。

SharePoint的搜索着实强大，而且最近用到SharePoint搜索第三方爬网，感觉收获挺大，而且网上资料没找到太多类似的，就小记录一下，分享给大家。

????? 首先，我自己写了一个net页面，里面读取所有我需要内容，充当SharePoint爬网的数据源，对这个页面进行爬网，页面如下图：

SharePoint 如何搜索爬网第三方网站配置_本站

????? 然后，打开SharePoint管理中心，搜索设置，新建内容源Crawl，爬网http://moss:9000，如下图。爬网设置可以按照自己的需要进行设置，比如想要爬网页面深度，可以进行设置，我的爬网，只是爬网页面下面的链接，所以深度设置为1；设置完成，先不要爬网，还需要设置爬网规则。

SharePoint 如何搜索爬网第三方网站配置_本站

设置爬网规则：

????? 打开爬网规则，设置路径，我的路径是9000端口下的所有页面，所以设置为http://moss:9000/*，当然，你的规则应该按照需要进行设置，可以排除这些路径，也可以包含这些路径，同时，如果有爬网到的任何结果，都可以在这里进行排除。

????? 特别的是，我的页面上的链接，包含“?”问号，所以勾选了对复杂的URL进行爬网，下面的指定认证，可以选择认证的账号，如果需要Form认证的网页，可以设置指定其他内容访问账户【特别：如果登录需要验证码的，SharePoint是无法爬网的】。设置完爬网规则，点击确定保存，然后可以对Crawl内容源进行完全爬网了。

SharePoint 如何搜索爬网第三方网站配置_本站