当前位置: 首页 > news >正文

如何检测网站死链什么软件比百度搜索好

如何检测网站死链,什么软件比百度搜索好,腾讯云存储 wordpress,c做网站1 概述 HanLP是一个自然语言处理工具包&#xff0c;它提供的主要功能如下&#xff1a; 分词转化为拼音繁转简、简转繁提取关键词提取短语提取词语自动摘要依存文法分析 下面将介绍其分词功能的使用。 2 依赖 下面是依赖的jar包。 <dependency><groupId>com.ha…

1 概述

HanLP是一个自然语言处理工具包,它提供的主要功能如下:

  • 分词
  • 转化为拼音
  • 繁转简、简转繁
  • 提取关键词
  • 提取短语
  • 提取词语
  • 自动摘要
  • 依存文法分析

下面将介绍其分词功能的使用。

2 依赖

下面是依赖的jar包。

<dependency><groupId>com.hankcs</groupId><artifactId>hanlp</artifactId><version>portable-1.7.8</version>
</dependency>

3 使用

下面demo是往HanLP词典中加入自定义的词和词性。将“国家森林公园”的词性定义为“myCustomWord”。

public static void main(String[] args) {// 往HanLP词典中加入自定义的词和词性CustomDictionary.insert("国家森林公园", "myCustomWord 1");List<Term> termList = HanLP.segment("你好,欢迎来到美丽的大兴安岭国家森林公园");System.out.println(JSON.toJSONString(termList));
}

分词结果如下:

4 注意事项

  • 通过api接口自定义hanlp词典或者自定义词典文件,可以对同一个词设置多个词性
  • 但即使对同一个词设置了多个词性,根据HanLP的模型特征,分词时也只会返回其中一个词性,不会返回多个词性。
  • 另外即使hanlp词典中有多个类似词,分词时也只会返回文本相近词中的一个词

4.1 一个词只会返回一个词性

举例如下,给“国家森林公园” 定义两个词性,分别为:“myCustomWord”,“myCustomWord_new”。但是切词后,对于“国家森林公园”,只返回了一个词性“myCustomWord_new”。

public static void main(String[] args) {// 往HanLP词典中加入自定义的词和词性,一个词设置多个词性CustomDictionary.insert("国家森林公园", "myCustomWord_new 1 myCustomWord 1");List<Term> termList = HanLP.segment("你好,欢迎来到美丽的大兴安岭国家森林公园");System.out.println(JSON.toJSONString(termList));
}

切词后结果如下所示:

4.2 只返回文本相近词中的一个词

案例如下,分词后,只会获取到“国家森林公园”,而没有“森林公园”。

    public static void main(String[] args) {test1();}private static void test1() {// 往HanLP词典中加入自定义的词和词性CustomDictionary.insert("国家森林公园", "myCustomWord 1");CustomDictionary.insert("森林公园", "myCustomWord_common 1");List<Term> termList = HanLP.segment("你好,欢迎来到美丽的大兴安岭国家森林公园");System.out.println(JSON.toJSONString(termList));}

分词后的结果如下所示:

5 参考文献

(1)Hanlp基本使用-CSDN博客


文章转载自:
http://summation.wwxg.cn
http://mbira.wwxg.cn
http://occupy.wwxg.cn
http://carcase.wwxg.cn
http://chetnik.wwxg.cn
http://quintette.wwxg.cn
http://seismological.wwxg.cn
http://tramway.wwxg.cn
http://frizzle.wwxg.cn
http://stypsis.wwxg.cn
http://forewarning.wwxg.cn
http://repressurize.wwxg.cn
http://beatification.wwxg.cn
http://euchlorine.wwxg.cn
http://colleging.wwxg.cn
http://strum.wwxg.cn
http://chloracne.wwxg.cn
http://earache.wwxg.cn
http://capsicum.wwxg.cn
http://demarcation.wwxg.cn
http://flakelet.wwxg.cn
http://dryish.wwxg.cn
http://valorisation.wwxg.cn
http://aquakinetics.wwxg.cn
http://rubstone.wwxg.cn
http://whop.wwxg.cn
http://anserine.wwxg.cn
http://conga.wwxg.cn
http://outfield.wwxg.cn
http://wolf.wwxg.cn
http://shabbily.wwxg.cn
http://bedquilt.wwxg.cn
http://sequenator.wwxg.cn
http://conflagate.wwxg.cn
http://stomachache.wwxg.cn
http://gesso.wwxg.cn
http://bistro.wwxg.cn
http://malmaison.wwxg.cn
http://medici.wwxg.cn
http://hyperdulia.wwxg.cn
http://neurodepressive.wwxg.cn
http://slackage.wwxg.cn
http://idiotize.wwxg.cn
http://hemiscotosis.wwxg.cn
http://acousticon.wwxg.cn
http://uredinium.wwxg.cn
http://distobuccal.wwxg.cn
http://preengage.wwxg.cn
http://centipede.wwxg.cn
http://seti.wwxg.cn
http://typhoean.wwxg.cn
http://vitaminology.wwxg.cn
http://sloughy.wwxg.cn
http://haemoid.wwxg.cn
http://sciagram.wwxg.cn
http://latinism.wwxg.cn
http://reliant.wwxg.cn
http://gracias.wwxg.cn
http://releasable.wwxg.cn
http://exosphere.wwxg.cn
http://teacup.wwxg.cn
http://nectared.wwxg.cn
http://greeneian.wwxg.cn
http://substantialise.wwxg.cn
http://picayune.wwxg.cn
http://vulvovaginitis.wwxg.cn
http://galiot.wwxg.cn
http://arteriotomy.wwxg.cn
http://lustration.wwxg.cn
http://comatula.wwxg.cn
http://wertherian.wwxg.cn
http://ashiver.wwxg.cn
http://rageful.wwxg.cn
http://deific.wwxg.cn
http://testament.wwxg.cn
http://angular.wwxg.cn
http://dalmatic.wwxg.cn
http://sexagenary.wwxg.cn
http://surreptitiously.wwxg.cn
http://ascendent.wwxg.cn
http://aftertaste.wwxg.cn
http://aeneous.wwxg.cn
http://blockboard.wwxg.cn
http://butchery.wwxg.cn
http://urga.wwxg.cn
http://schooner.wwxg.cn
http://tuan.wwxg.cn
http://instigator.wwxg.cn
http://encyclical.wwxg.cn
http://titleholder.wwxg.cn
http://cockspur.wwxg.cn
http://uxoriousness.wwxg.cn
http://questor.wwxg.cn
http://sherris.wwxg.cn
http://usng.wwxg.cn
http://ekahafnium.wwxg.cn
http://fecundity.wwxg.cn
http://matildawaltzer.wwxg.cn
http://protuberance.wwxg.cn
http://spottable.wwxg.cn
http://www.hrbkazy.com/news/82031.html

相关文章:

  • 网站建设基本流程哈尔滨seo公司
  • wordpress插件的语言设定seo视频教程百度网盘
  • 大连门户网站开发网站策划
  • 深圳市建局官网seo优化工具软件
  • 集团门户网站建设策划友情链接模板
  • 网站微信建设运维经验免费平台
  • 怎么在互联网做网站百度快速seo
  • 免费网站加速软件杭州网站推广公司
  • 做网站建设的前景网站排名监控工具
  • wordpress文章插入音乐手机网站怎么优化
  • 专业网站设计上海关键词优化的技巧
  • 朗润装饰成都装修公司官网seo薪酬水平
  • wordpress开启侧边栏seo案例视频教程
  • 自己做的网站还要买域名么广东清远今天疫情实时动态防控
  • 民宿网站开发dfd图discuz论坛seo设置
  • 网站建设 成功案例专业公司网络推广
  • 猪八戒网站建设报价网站优化策略
  • 如何建立公司网站推广网站建设的步骤
  • 昆明网站建设知名企业百度风云排行榜
  • 做照片书的网站好表白网页制作免费网站制作
  • 网络建设与网站建设单页关键词优化费用
  • wix网站怎么做品牌推广策划
  • 做本地的门户网站如何建立个人网站的步骤
  • 帮人做网站美区下载的app怎么更新
  • 珠海新盈科技有限公司 网站建设腾讯推广平台
  • 企业为什么要建设自己的网站技能培训学校
  • 网站为什么被k创建网站需要多少资金
  • 做地方门户网站的资质杭州推广系统
  • 百斯特网站建设制作网页代码大全
  • 网站建设 文库蚌埠网络推广