【www.guakaob.com--会计继续教育】
没有任何办法的词语篇一
《无词典的中文文档集特征词抽取方法》
没有任何办法的词语篇二
《一种中文文档的非受限无词典抽词方法》
中 文 信 息 学 报
第‘•卷第–期 JOURNALOFCHINESEINFORMATIONPROCESSINGVol.‘•No.–
一种中文文档的非受限无词典抽词方法
金翔宇 孙正兴 张福炎
ˆ南京大学软件新技术国家重点实验室 ¹南京大学计算机科学与技术系 南京 ’‘••™“‰
摘要š本文提出了一种非受限无词典抽词模型Œ该模型通过自增长算法获取中文文档中的汉字结合模式Œ并引入支持度!置信度等概念来筛选词条"实验表明š在无需词典支持和利用语料库学习的前提下Œ该算法能够快速!准确地抽取中文文档中的中!高频词条"适于对词条频度敏感Œ而又对计算速度要求很高的中文信息处理应用Œ例如实时文档自动分类系统"
关键词š中文信息处理›自动分词›非受限无词典抽词›汉字结合模式
中图分类号š´°“™‘
ADomain2independentDictionary2freeLexicalAcquisitionModel
ForChineseDocument
ª©®¸ÉÁÎÇ2ÙÕ ³µ®ºÈÅÎÇ2ØÉÎÇ º¨¡® ¦Õ2ÙÁÎ
ˆ³ÔÁÔÅ«ÅÁÂÏÒÁÔÏÒÏÖÅÌ̳ÏÆÔ×ÁÒÅ´ÅÃÈÎÏÌÏÇÙŒ¤ÅÒÔÍÅÎÔÙ¬ÙÆÏÒ®ÐÁ
ÏÆ£ÏÍÐÕÔÅÒ³ÃÉÅÎÃÅÁÎÄ´ÅÃÈÎÏÌÏÇÁÎÊÉÎǵÎÉÖÅÒÓÉÔÁÎÊÉÎÇ ’‘••™“‰ÙŒ®Ù ®
Abstract:¡ÄÏÍÁÉÎ2ÉÎÄÅÐÅÎÄÅÎÔÄÉÃÔÉÏÎÁÒÒÅÅÌÅØÉÃÁÌÁÃÉÓÉÔÉÏÎÍÏÄÅÌÉÓÐÒÅÓÅÎÔÅÄÉÎÔÈÉÓÐÁ2Ù2ÆÑÕ
ÒŒ×ÈÉÃÈÉÎÔÒÏÄÕÃÅÓÁÓÅÌÆ2ÉÎÃÒÅÁÓÉÎÇÁÌÇÏÒÉÔÈÍÔÏÁÃÉÒÅÔÈÅÃÏ2ÏÃÃÕÒÒÅÎÃÅÐÁÔÔÅÒÎÓÏÆ£ÈÉÎÅÓÅÐÅÑÕ
ÃÈÁÒÁÃÔÅÒÓŒÁÎÄÉÎÔÒÏÄÕÃÅÓÓÏÍÅÃÒÉÔÅÒÉÁÓÕÃÈÁÓÓÕÐÐÏÒÔÁÎÄÃÏÎÆÉÄÅÎÃÅÔÏÆÉÌÔÅÒÔÈÅÓÅÃÏ2ÏÃÃÕÒÒÅÎÃÅÁÔÔÅÒÎÓÔÏÇÅÔÌÅØÉÃÁÌÉÔÅÍÓŽ¥ØÐÅÒÉÍÅÎÔÓÓÈÏ×ÔÈÁÔÉÔÃÁÎÁÃÉÒÅÌÅØÉÃÁÌÉÔÅÍÓ×ÉÔÈÈÉÒÅÅÎ2ÐÑÕÇÈÆÑÕÃÆÆÅÃÔÉÖÅÌÙÁÎÄÅÆÆÉÃÉÅÎÔÌÙ×ÉÔÈÏÕÔÔÈÅÓÕÐÐÏÒÔÏÆÔÈÅÄÉÃÔÉÏÎÁÒÈÅÓÕÐÅÒÖÉÓÅÄÌÅÁÒÎÉÎÇÉÎÙÅÙÁÎÄÔ
ÔÅÒÍÏÆÃÏÒÓŽ´ÈÅÍÏÄÅÌÐÒÏÐÏÓÅÄÉÎÔÈÉÓÐÁÐÅÒÐÁÒÔÉÃÕÌÁÒÌÙÓÕÉÔÓÆÏÒÌÅØÉÃÁÌ2ÆÒÅÅÎÃÅÎÓÉÔÉÖÅÐÕÑÕÙ2ÓÂÕÔÔÉÍÅ2ÃÒÉÔÉÃÁÌ£ÈÉÎÅÓÅÉÎÆÏÒÍÁÔÉÏÎÐÒÏÃÅÓÓÉÎÇÁÐÐÌÉÃÁÔÉÏÎÓŒÓÕÃÈÁÓÒÅÁÌÔÉÍÅÁÕÔÏÍÁÔÉãÈÉÎÅÓÅÔÅØÔÃÌÁÓÓÉÆÉÃÁÔÉÏÎÓÔÅÍÓŽÙÓ
Keywords:ÃÈÉÎÅÓÅÉÎÆÏÒÍÁÔÉÏÎÐÒÏÃÅÓÓÉÎÇ›ÁÕÔÏÍÁÔÉÃ×ÏÒÄÓÅÇÍÅÎÔÁÔÉÏΛÄÏÍÁÉÎ2ÉÎÄÅÐÅÎÄÅÎÔÄÉÃ2ÔÉÏÎÁÒÒÅÅÌÅØÉÃÁÌÁÃÉÓÉÔÉÏΛÃÏ2ÏÃÃÕÒÒÅÎÃÅÐÁÔÔÅÒÎÓÏÆ£ÈÉÎÅÓÅÃÈÁÒÁÃÔÅÒÓÙ2ÆÑÕ
¹收稿日期š’••‘••‘•‘—›修改稿收到日期š’••‘••–•‘’
基金项目š国家自然科学基金项目ˆ–™™•“••–‰›教育部高等学校骨干教师资助计划ˆ教技司»’•••½–•号‰›中国博士后科学基金ˆ中博基»‘™™—½‘‘号‰
作者金翔宇Œ男Œ‘™——年生Œ硕士研究生Œ研究方向为中文信息处理Œ视觉信息挖掘Ž孙正兴Œ男Œ副教授Œ博士后Œ研究方向为多媒体辅助工程Œ智能信息处理Ž张福炎Œ教授Œ博导Œ研究方向为多媒体技术Œ数字化图书馆Ž
““
一!引言
词语是语义表达的基本单位"由于汉语句子中的词语之间没有明显的形态间隔Œ因此Œ在进行汉语信息处理时要根据应用并按一定的规范进行词语切分Œ即分词"自动分词一直是中文信息处理研究的一个热点和难点Œ国内外学者们对中文文档的自动分词进行了大量研究Œ提出了许多自动分词方法»‘*“½"这些方法可分为两大类š一类是基于词典的机械分词Œ另一类是基于语法知识的分词"机械分词的速度由分词方法本身以及词典的组织结构所决定Œ自动分词的研究工作有相当一部分是围绕这两个方面开展的Œ但机械分词需建立在词典完备的理想假设下Œ任何常用词典和专业词典都不可能涵盖所有的词语Œ据吴立德的统计»“½š在含有‘万•千个词条的语料库中Œ即使用七万个词条的词典Œ仍然有“•…以上的词条没有被收录"切分歧义和词典生词限制了机械分词的分词准确度»”*–½Œ而且Œ词典对分词精度造成的影响远远大于分词方法自身产生的歧义切分错误"
随着语料库研究和计算语言学的发展Œ出现了基于语法知识的分词"孙茂松»˜½和郑家恒等»™½提出了利用语料库来统计姓名用字规律并根据前后约束用词等信息建立局部规则Œ从而实现中文姓名的自动识别›张小衡等»‘•½以实际语料为依据Œ从语言学角度总结了机构名称的构造规则"在专业词汇的识别上Œ黄萱菁等»‘‘½提出了在领域语料库的基础上利用V’•统计量来自动生成该领域专业词典的方法"这些研究所得到的规则和专业词典对于机械分词方法具有一定的辅助作用"但由于自然语言的计算机形式化工作非常困难Œ而且汉语的语法更为灵活和复杂Œ用于分词的知识往往是不完备的!甚至是矛盾的"因此Œ语法方法所能够达到的准确度离期望相差很大"
从目前的应用来看Œ尤其是在·ÅÂ环境下Œ中文信息处理对象由少量!规范的例句扩大到大规模!非规范的文本›中文信息处理范围由单个典型的领域扩大到多个开放的领域Œ这样Œ词典对分词精度的影响更为突出"和歧义校正上的大量工作相比Œ国内在自动识别词典未登录词Œ特别是各种专业领域术语方面的工作还不是很多Œ对于涉及多领域的大规模真实文本实时处理系统Œ例如文档自动分类系统Œ目前尚缺乏一种切实可行的分词方法"据此Œ本文针对分类!摘要等频度敏感的中文信息处理要求Œ提出了基于汉字结合模式的无词典抽词思想Œ并对获取和筛选汉字结合模式的智能化方法进行了研究Œ在此基础上设计了一种非受限无词典抽词模型›最后给出了相应的实验结果和评价"
二!无词典抽词方法
’Ž‘ 无词典抽词的基本思想
事实上Œ中文信息处理的不同应用对词条信息的要求是不同的"我们将中文信息处理划分为/词条位置敏感0和/词条频度敏感0两类应用"机器翻译!语言转换等就属于第一类"这类处理工作要求词条的切分要准确无误Œ尤其是歧义问题的处理Œ此时采用基于词典的分词方法辅以歧义校正规则是比较合适的"第二类应用关心的是词条频度信息Œ不关心词条的位置信息Œ分类属于此种类型"对于此类应用Œ分词的目标是保证中高频词条!尤其是对文档主题特征起重要作用的专业词汇的正确识别"显然Œ基于词典的分词方法不能可靠地用于这类工作"
虽然汉语的词汇是开放!动态的Œ但对每一个具体的文档而言Œ用词是相对封闭!静态的"我们认为š在对文档中的汉字结合模式进行统计观察的基础上Œ可使得分词过程不依赖于词“”
典"这种分词实质上是抽词Œ是使用统计方法直接从文档中识别词条的过程"使用抽词代替人工编制词典或经语料库的学习训练生成字典可使中文信息处理既具有较强的针对性Œ又可摆脱词典的束缚而具有较强的适应性Œ如图‘所示"汉字结合模式的确定及汉字结合模式的筛选是决定无词典抽词方法能否成功的关键
"
’Ž’ 汉字结合模式获取 为简化讨论Œ下文中Œ汉字全集记为
¨›空格字符记为t"预处理后的文档用
字符串Ó•ÓÓ‘Ó’,ÓΕ‘ÓÎ表示ŒÉI¨GÛtÝ
且ÓÓ文档中的任何一É!É‹‘不能同时为t›
个子串Ó文档中的真实词É,ÓŒÊ记为ÓœÉÊž›
条记为wŒ所有真实词条的集合称为该文
档的真实词条集Œ记为5›获取的每一种汉
字结合模式记为XŒ文档中的所有汉字结
合模式构成该文档的候选词条集Œ记为
7›对候选词条集7中的汉字结合模式进
行分析!筛选Œ得到的词条称为文档的识
图‘ 中文信息处理流程比较别词条集Œ记为8"下面给出从文档中获
取汉字结合模式的一种快速算法"
首先Œ将文档Ó的候选词条集7置为空集Œ7中记录每种字符结合模式及其在文档中的频度›然后Œ从文档首端开始向文档尾端进行扫描Œ在扫描时先从文档中取’个连续的汉字作为待匹配字串Œ查找候选词条集Œ如果找到匹配的模式Œ则将待匹配字串长度增加‘Œ重新进行查找匹配过程Œ一直到扫描不到连续的汉字字符或者无法在7中找到匹配的模式"将该过程中发生匹配的最长模式的频度加‘Œ并将找不到匹配模式的字串为一种新的模式加入到7中›接着Œ从发生不匹配的字符开始重复上述扫描过程直到文档扫描完毕"在对文档进行扫描的过程中Œ随着字串的自动增长Œ不断获得新的汉字结合模式Œ从而得到最终的候选词条集7Œ因此该算法也称为汉字结合模式的自增长获取算法"该上述算法只需要对文档进行一次单向扫描即可获得该文档的汉字结合模式"算法的伪码描述如图’所示"下面对该算法复杂度进行分析"
文档中汉字结合模式的自擅长获取算法
输入š文档
输出š文要的候选词条集合7
算法š
‘Ž7z空集Œ文档的扫描指针Ðz文档起始位置‘Œ临时指针ÑzÐ
’ŽÒÅÐÅÁÔ
“Ž ÒÅÐÅÁÔ
”Ž ÑzÑ‹‘
t•ŽÕÎÔÉ̈ӈӌ3ÐŒ4I7‰ÏÒÑÑ•‰
–ŽÉƈӌѕt‰ÔÈÅÎ将Ó的频度加‘ŒÐzÑ‹‘3ÐŒÑ4
—ŽÅÌÓÅ7zÓ并将Ó将Ó的频度加‘ŒÐzÑ"3ÐŒ4G7Œ3ÐŒ4的频度置为‘Œ3ÐŒÑÑÑ•‘4
˜ŽÕÎÔÉ̈Ð\Ή
“•
设7中的词条最多为«个Œ则对7进行查询的复杂度为ÌÏÇ’«
即该算法的时间复杂度为¯ˆÎÌÏÇ’«‰"事实上Œ由于文档中的用词相对封闭Œ因此7中的候选词条数目并不是随着文档长度的增加而线性增长"在实验中可以观察到Œ当文档长度增加到一定程度时ˆ‘•«以上‰Œ候选词条数目增长缓慢Œ基本上稳定在“•••左右"因此汉字结合模式的自增长获取算法的实际时间复杂度是¯ˆÎ‰"
从以上算法描述可以看出Œ若结合模式S3r,t4I7,则必有其子结合模式S3r,t•‘4I7,依次类推,可得到S3r,t•’4I7,,S3r,r‹‘4I7"因此Œ一般而言Œ一个长度为Ë的词条被识别出来的必要条件是它在文档中至少出现Ë•‘次ˆ假设该词汇和其他的词汇没有重复的子结合模式‰"所以Œ自增长算法只有在中高频词条的识别上才会表现出较好的效果"
’Ž“ 汉字结合模式筛选
汉字结合模式的获取是建立在对文档中的汉字结合模式进行统计的基础上Œ由于缺乏语法!语义知识的辅助Œ因此所生成的候选词条集中包含了许多并不能够构成真实词条的汉字结合模式"在自增长算法中Œ按原因的不同Œ出错模式可大致分为/偶然型0!/过程型0和/冗余型0三种类型"
定义‘š/偶然型0汉字结合模式Œ是指组成该模式的若干个汉字并不能够构成真实词条Œ但由于偶然连续出现而被作为了候选词条"
以句子/存储器的价格不断下降0为例Œ自增长算法除了生成/存储器0!/价格0!/不断0!/下降0等真实词条模式时Œ还会产生/器的0!/的价0!/格不0!/断下0等/偶然型0汉字结合模式"在大多数情况下Œ自增长算法在获取汉字结合模式的过程中产生的/偶然型0汉字结合模式的频度均为‘"我们引入下面定义š
定义’š候选词条集7中任一种汉字结合模式X在文档Ó中的出现频度„(X,s)称为该模式的支持度(Support)"
引入支持度概念后Œ对候选词条集7中的每一种汉字结合模式可使用/³ÕÐÐÏÒÔ\’0的过滤器来去除所有/偶然型0汉字结合模式"需要说明的是Œ该过滤器同时也会去除一些支持度仅为‘的真实词条模式Œ从而降低词条识别的召回率"
定义“š/过程型0汉字结合模式Œ是指在生成真实词条模式的自增长过程中产生的错误模式"
例如š在产生人名/车尔尼雪夫斯基0过程中Œ被作为汉字结合模式加入到候选词条集中的汉字串有š/车尔0!/尔尼0!/尼雪0!/雪夫0!/夫斯0!/斯基0!/车尔尼0!/尼雪夫0!/夫斯基0!/车尔尼雪0!/雪夫斯基0!/车尔尼雪夫0!/车尔尼雪夫斯0和/车尔尼雪夫斯基0"前‘“种模式都是在生成第‘”种模式的过程中而生成的Œ由于汉语词条的/过程型0结合模式重叠的几率很小ˆ例如/雪夫0除了出现在/车尔尼雪夫斯基0中以外Œ几乎不会出现在其他结合模式中‰Œ因此自增长算法产生的/过程型0汉字结合模式的频度很低"实验证明Œ过程型0汉字结合模式的频度在大多数情况下均为‘和’"利用定义’Œ可使用/Support\“0的过滤器来去除所有/过程型0汉字结合模式"该过滤器可能会同时去除一些支持度小于“的真实词条模式Œ从而降低词条识别的召回率"
定义”š/冗余型0汉字结合模式Œ是指由于增长长度过长Œ在真实词条模式后面或前面加上了冗余的汉字而形成的错误模式"
冗余的汉字通常是一些常用的助词!代词或介词Œ例如š/搜索引擎0是一个真实词条Œ而/搜索引擎中0!/在搜索引擎0等汉字结合模式并不是词条Œ但是由于出现频度较高而被加入到“–
候选词条集中"这种错误没有固定的词频Œ因此不能够简单地使用支持度来将其去除"此外Œ真实词条的前后加上汉字并不一定就是错误Œ有时恰恰会生成一些新的术语Œ例如š/元搜索引擎0Œ因此有必要将二者区分开来"
定义•š在候选词条集7中Œ如果汉字结合模式X‘添加后缀汉字串suff后构成汉字结合模式X’,即X’•X‘‹suff(或添加前缀汉字串pref后构成汉字结合模式X’,即X’•pref‹X‘),那么模式X’在文档中的出现频度与模式X‘在文档中的出现频度之比称为模式X’相对于模式X‘的置信度Œ即š
Confience(X’|X‘)=„(X’,s)
„(X‘,s)
模式X’相对于模式X‘的置信度Confience(X’|X‘)反映了模式X‘与前缀汉字串或后缀汉字串结合的稳定性,即模式X’构成词条的可能性"如果置信度低于下限,则说明模式X’构成词条的可能性很小,因此可以去除"如果置信度位于上限和下限之间,那么模式X‘!X’可以共存于候选词条集中"在后缀情况下,如果置信度高于上限,则说明模式X‘基本上包含于X’之中"按照最大匹配原则,模式X‘可去除"实际使用中Œ置信度的上限设定为•Ž™•!下限设定为•Ž“•时Œ使用上述方法可去除大部分的/冗余型0汉字结合模式Œ同时保留大部分的真实词条模式"以一篇题为/·ÅÂ信息检索技术研究进展0的文档为例Œ候选词条集中包含一些模式š模式X‘•/搜索0,模式X’•/搜索引擎0,模式X“•/元搜索引擎0,模式X”•/搜索引擎中0;„ˆX‘,s)•—‘Œ„ˆX’,s)•–™Œ„(X“,s)•—Œ„ˆ/元0Œs)•—Œ„ˆX”,s)••›因此Œ模式X‘ŒX“将被保留而X‘ŒX”将被去除"
’Ž” 非受限无词典抽词模型
根据上述讨论Œ我们设计了如图’所示的中文文档的非受限无词典抽词模型
"
图’ 中文文档的无词典抽词模型
三!实验结果与评价
我们的测试集中包含了近‘••-¢来源于/计算机世界报0ˆÈÔÔ••××׎ÐÃ×ÏÒÌÄŽÃÏ͎К
ÃΉ!/网络世界0ˆÈÔÔ••××׎ÃÃ׎ÃÏÍŽÃΉ!/微电脑周刊0ˆÈÔÔ••××׎ÃÎ׎ÃÏÍŽÃΉ等КК
·ÅÂ站点共‘‘Œ””•篇计算机领域的中文文档Œ测试平台为奔腾’••--¸Œ–”-内存"实验中采用非受限无词典抽词模型对上述所有的中文·ÅÂ文档进行了自动抽词"主要测试内容为无词典抽词的速度和准确度"在抽词有效性上Œ除了测试抽词结果本身的准确度ˆ包括精度和召回率‰Œ还要考察抽词对后续中文处理工作ˆ例如分类‰的影响"
“Ž‘ 抽词速度测试及其分析
我们对测试集中的所有文档进行抽词并记录抽词时间›然后Œ将文档按照大小分为“*•«!•*‘•«!‘•*‘•«!‘•*’•«!’•«以上等•个组Œ计算各个组中文档的平均抽词时间"各
“—
没有任何办法的词语篇三
《一份无节操的背单词方法》
【福利】一份无节操的背单词方法--------@英语分享控 [转]
前言:本教程只对GRE基本词汇中的难词,因此根据网友建议更名为《三天背完GRE难词》(有网友戏称为《黄宝书》,真的很黄吗?自己看吧!),对于我们在Tofel,CET-6,GMAT常见的词尽量不予收录。
使用方法:
1。马上要考试的网友:在复习累了的时候拿起本文,权当一笑,同时强化检查一下自己的词汇。
2。太傻或其它GRE词汇背过一遍以上的网友:反复阅读本教程,对太傻词汇进行巩固。我认为本文对背过一遍GRE词汇的网友是最有用的。
3。新手:学习本教程,只能使你对单词,有个初步印象。建议每章研读3遍,间隔10分钟以上,再进入下一章。如果你一口气读完,我相信你一定一无所获!
如果以后再见到本文中的单词,能感觉到"这单词,我好象以前见过...","好象是...意思",松松的目的就达到了。更深一步的学习要通过英文释意,类比和反义,阅读和作题中掌握。
谨以此文献给为了考G而放弃爱情和至今孤身一人的网友!考G的人都是最优秀的人,最优秀的人要拥有最伟大的爱情!!!
有任何建议请给松松来信(liusongday@hotmail.com),请不要把本文用于商业目的,转载请保持文章完整!
松松泡妞绝技之(一)
各位看官,小弟(liusongday@hotmail.com)纵横情场数十年,已经达到acme,于今日收山,
特把本人绝技公布,以飨G友。
权当是小弟的autobiography。天那么的azure,美女那么多,我们可不能浪费自然资源
哦!
一。声明:
1. 此秘籍只对adolescent,如果你年龄35岁以上,你可以花钱去泡妞了。
2,如果你很austere,或许把我当作流氓。其实哪个男孩不amorous,除非他是
anchorite!
3,如果你是道中人,修行比我高,我愿意给你做apprentice。我只达到了我自己的apex,
人外有人。
同时,即使是高手,你看完我的文章,对你也有auxiliary的作用。
4,如果你愿意跟我学,我们就是战友,说不定某一天成为adversary。情场无父子!
二,axiom:
没有搞不定的女孩,只因为你不够audacity。
三,aphorism:
aplomb,apropos,artifice
aplomb, 这是做任何事情的基本素质。
apropos, 任何事情都要自然,不要给女孩以突兀的感觉。
artifice,这一步是我重点传授给你们的。
四,apothegm:
antic: 幽默感很重要,哪个女孩喜欢书呆子?
arduous: 要有吃苦的准备哦。
FAQ:
1。美女A:你教男生泡妞,我们女生怎么得到aegis?
松松:别急,不久我会出台我女朋友写的“美女anti被泡秘籍”。
2。某丑男:我很affliction,因为我很丑,女孩都说我长得象anthropoid,跟着您老学,
也能成功吗?
松松:呵呵,泡妞一点也不arcane,只要仔细研读本秘籍,我会让你avenge的。
3。我没有asset,很穷的,也没有affinity,也能有女孩喜欢我吗?
松松:请affiliate我们,你会成功!
4。某帅哥:我认识一个女孩很arresting,但是很artful,对我aloof,我请她吃饭,
她总是有alibi,我该怎么办?
松松:他对你有animus,说明她对你apathetic,该怎么办?请继续关注本秘籍。
1。acme: n.顶点, 极致
2。autobiography: n.自传
3。azure: adj.蔚蓝的
4。adolescent: adj.青春期的, 青春的
5。austere: adj.严峻的, 严厉的, 操行上一丝不苟的, 简朴的
6。amorous: adj.多情的, 恋爱的, 表示爱情的
7。anchorite: n.隐者, 隐士
8。apprentice: n.学徒
9。apex: n.顶点
10。auxiliary: adj.辅助的, 补助的
11。adversary: n.敌手, 对手
12。axiom: n.[数]公理
13。aphorism:n.格言, 警语, 谚语
14。aplomb: n.沉着, 泰然, 垂直
15。apropos: adj.adv.适当地, 恰好的
16。artifice: n.技巧
17。apothegm: n.格言, 箴言, 警句
18。antic: n.丑角, 滑稽动作 adj.奇特的, 滑稽可笑的
19。arduous:adj.费劲的, 辛勤的, 险峻的
20。aegis: n.保护, 庇护, 支持
21。affliction: n.痛苦, 苦恼
22。anthropoid: n.类人猿
23。arcane: adj.神秘的, 不可思议的
24。avenge: vt.为...报复, 报仇
25。asset: n.资产, 有用的东西
26。affinity: n 吸引力, 姻亲关系, 亲合力,.密切关系
27。affiliate: v.(使...)加入, 接受为会员
28。arresting: adj.引人注意的, 可观的
29。artful: adj.巧妙的, 狡猾的
30。aloof: adj.孤零的, 冷淡的
31。alibi: n.辩解, 托辞,[律]犯罪现场
32。animus: n.敌意, 意图
33。apathetic: adj.缺乏兴趣的, 缺乏感情的, 无动于衷的
----------------------------------------------------------------------------------------------
松松泡妞绝技之(二)
各位太傻论坛的看官,今天的主讲内容是怎么认识女孩,你即使空有一身讨女孩欢心的本
领,可是一个女孩也不认识,怎么办?
因此accost女孩是泡妞的第一步。
BTW,松松(liusongday@hotmail.com)的信箱收到许多来自太傻论坛网友的信件,有鼓励,有castigation.
更有MM说我carnal,我真的很chagrin,
我特此avow:如果有MM被atrocity本人概不负责,
如果有MM的男友看了本秘籍avert his eyes on other girls,本人也概不负责。其实:男人
本来就是caprice的,女孩也是chameleon。
还有男生来信说我是charlatan和braggadocio,在太傻论坛发布blatant。本人绝没有bombast,给你个cogent证据,本人kiss过100多个女生.....别的就不用说了吧! 毕竟我们是coeval,应该是没有chasm或代沟的。
言归正传:
方法一:
我先教你入门的circumlocutory方法,也就是最简单和circumvent的方法,然后再一步一步 进阶。最brevity的方法如下:
1。首先2个男生coalesce形成一个clique,俗话说孤掌难鸣啊,尤其在你功力还很浅的时 候!
没有任何办法的词语篇四
《基于无指导机器学习的全文词义自动标注方法》
没有任何办法的词语篇五
《词语解释》
第1课:《太阳的话》
香气:很好闻的气味。
晨曦:早晨的太阳光。
花束:成束的花。
温暖:暖和,不冷也不热。
第2课:《享受森林》
享受:物质上或精神上得到满足。
繁密:多而密。
朝气蓬勃:形容生气勃勃,充满活力。
四面八方:指各个方面或各个地方。
第3课:《小黑鱼》
快乐:感到幸福获满意,开心而舒畅。
漆黑:非常黑,很暗。
充满:填满、布满。
清凉:清爽、凉快。
第4课:《沙滩上的童话》
相约:相互约定。
建造:修建、建筑。
商量:交换意见,讨论。
赞赏:赞美、赏识。
第5课:《我的房间》
幻想:依照自己的理想或愿望对还没有实现的事物进行想象。
第6课:《马鸣加的新书包》
一股脑儿:通通,全部。
羞愧难当:感到实在惭愧、难为情。
《生字卡片》:
高枕无忧:垫高枕头安心睡觉。形容太平无事,无所顾虑。也形容麻痹大意,放
松警惕。
铺天盖地:形容来势猛、声势大。一下子到处都是。
枝繁叶茂:枝叶繁密茂盛。
枪林弹雨:枪支橡树林,子弹像下雨。形容战斗激烈,炮火密集。
深山老林: 与山外、林外距离远的、人迹罕至的山岭、森林。
腾云驾雾: 乘着云,驾着雾。原是传说中指会法术的人乘云雾飞行,后形容奔驰
迅速或头脑发昏。
插翅难飞: 插上翅膀也难飞走。比喻陷入困境,怎么也逃不了。
铜墙铁壁:比喻十分坚固,难以摧毁的食物。
载歌载舞:边唱歌,边跳舞。形容尽情欢乐。
骄阳似火:强烈的阳光好像烈火一样。形容天气炎热。
傲慢无礼:态度傲慢,对人不讲礼节。
娇生惯养:形容从小受到父母或老人的过分宠爱和纵容。
第二单元词语解释:
第7课《海中救援》
救援:帮助别人使脱离痛苦或危险。
营救:设法救援。
聚集:集合,凑在一起。
唯一:只有一个,独一无二。
气喘吁吁:形容呼吸急促,上气不接下气的样子。
毫不懈怠:对工作尽心尽力,一点也不松懈、懒惰。
精疲力竭:形容精神非常疲惫,没有一点力气。
月黑风高:比喻没有月光风也很大的夜晚。比喻险恶的环境。
紧急关头:十分危急的时刻。
挺身而出:面对着艰难或危险的事情,勇敢地站出来。
音讯全无:不管用什么联络方法都找不到此人,没有对方的任何消息和行踪 第8课《九色鹿》
感激:感动,感谢。
性命:生命。
寻找:觅取,寻求。
危险:不安全,有遭受失败或损害的可能。
忘恩负义:忘记别人对自己的恩情,做出对不起别人的事情。
又气又恨:又生气又愤恨。
无论如何:表示不管条件怎样变化,其结果始终不变。
第9课《医生的心思》
浪费:没有节制,白白耗费。
一言不发:一句话也不说。
检查:有心查看。
络绎不绝:形容车马、行人来来往往,连接不断。
笑容可掬:形容笑容满面的样子。
第10课《迷人的蝴蝶谷》
光辉:闪烁而耀眼的光。
翩翩起舞:形容轻快优美地跳舞的样子。
独一无二:只有这一个,没有第二个。形容唯一的,没有相同或可以相比的。 色彩斑斓:形容色彩错杂灿烂的样子。
第11课《美丽的西双版纳》
发愁:因为没主意或办法而感到愁闷。
悠然自得:形容态度从容,心情舒适的样子。课文形容象群自由自在的样子。 五彩缤纷:形容色彩鲜艳繁多。
助兴:帮助增加兴致。
美丽富饶: 地方风景漂亮而且物产丰富,生活富裕。
无边无际: 形容范围极为广阔,看不见边际。
耸立云霄: 形容山或者建筑物很高,直入云霄。
清甜可口: 食物本生的甜味,食用时的口感很好。
别有情趣: 另有一些趣味。
第12课《西湖名堤》
连绵起伏:山岭高高低低接连不断。
优美:美好。
掠过:轻轻擦过或拂过。
纪念:用事物或行动表示怀念。
层层叠叠: 一层又一层的意思。
桃红柳绿:桃花嫣红,柳枝碧绿。形容花木繁盛、色彩鲜艳的春景。
镶嵌: :①以物嵌入,作为装饰。②比喻深深地进入某种境界或思想活动。.
③把一物体嵌入另一物体内。
硕大: 1.高大。2.肥大;巨大。3.正大。
笼罩: 像笼子似的罩在上面。某物把物体完全遮住;广泛覆盖的样子。 《生字卡片》
五颜六色:比喻色彩鲜艳,式样繁多。
五湖四海:泛指全国各地。
转危为安:有危险转化为平安。
德高望重:品德高尚,享有很高的名望。
支离破碎:形容四分五裂,不成整体。
扣人心弦:形容事物激动人心。
纹丝不动:一动也不动。
浓眉大眼:又黑又密的眉毛,大大的眼睛。形容眉目有神的人。 第三单元词语解释:
13.《我给奶奶送阳光》
芬芳扑鼻:形容香气十分浓烈。
亮堂堂:形容很亮。
严严实实:非常严密;藏得好。
索性:干脆,表示直截了当。
沐浴:洗澡。课文中表现充分享受着阳光。
叽叽喳喳:象声词。形容杂乱细碎的声音。
安慰:通过语言等劝人心情安适。
念叨:因惦记或想念而经常在讲话中提到。
14.《只有一个孩子》
伶俐:聪敏,灵活。
特别:不一般,与众不同。
沉甸甸:形容很重。
晃荡:向两边摆动。
15.《在家里也该是个好孩子》
地覆天翻:形容变化极大,也形容闹得很凶。
布置:按要求安排陈列物品。
16.《做人的故事》
需要:要,应该有,必须有。
疲倦:疲劳,困倦。
沉醉:大醉。课文比喻沉浸、陶醉。
潺潺:象声词,溪水、泉水流动的声音。
沉思:认真、深入地思考。
羞愧:形容因做错事而内疚和惭愧。
17.《高尔基和他的儿子》
姹紫嫣红:形容各种好看的花。
探望:看望。
红扑扑:形容脸色红。
愉快:快乐,舒畅,开心。
欣赏:领略观赏。
芳香:香味(多指花草)。
《生字卡片》
漫山遍野:山上和田野里到处都是。形容很多。
伶牙俐齿:形容口才很好,能说会道。
莺歌燕舞:形容大好春光。形势很好。
跌跌撞撞:走路不稳。
欺软怕硬:欺负软弱的,害怕强硬的。
泪如雨下:眼泪象雨水似的直往下流。形容悲痛或害怕之极。 天翻地覆:形容变化极大,也形容闹得很凶。
出尔反尔:比喻言行前后矛盾,反复无常。
嫣然一笑:形容女子笑得很美。
庞然大物:形容体积大而笨重的东西。
没有任何办法的词语篇六
《八年级上册词语解释》
没有任何办法的词语篇七
《一种基于无监督学习的词变体识别方法》
上一篇:形容莫名其妙被抛弃的句子
下一篇:时间走的那么干脆