早在上世纪80年代,对语义EI检索的讨论就出现在SIGIR会议*中,但语义EI检索研究始终受制于语义信息处理发展水平的局限。随着自然语言处理、人工智能的发展,尤其是语义网技术的兴起与发展,语义EI检索研究自上世纪末以来得以迅速发展。语义信息EI检索就是要让用户在输入自然语言作为EI检索词的时候,能出现与该EI检索词相关的更多词,而不是机械地将与该EI检索词匹配到的所有信息一一列入EI检索结果。目前国内外语义信息EI检索研究主要集中在以下三个方面。
(1)基于本体的查询技术。查询技术首先涉及查询语言,由W3C推出的RDF、*RQL等系列查询语言已经可以实现对语义数据的查询并且应用广泛,如余传明博士阐述并比较了三种基于查询语言的EI检索机制。国外的研究一般集中在利用语言本体(如WordNet)中的同位词、上下位词以及上下文EI检索技术对所要查询的内容进行语义消歧并进行查询扩展,利用Word Net实现了地理信息的语义EI检索,保定职称*,另外Yong xiang Dou,Xiao xian Bei等人在Wi COM会议上对P22P网络信息内容进行语义查询和实现。不论是查询技术还是针对不同的查询对象,都涉及一项关键的技术,即语义相似度(或称相关度算法),语义相似度是指两个概念间的相似程度,目前多以研究路径长度方法、信息论方法和基于概念特征的方法三个方面为主。
(2)语义标注问题。语义标注可以标注元数据、概念、网页、文档,这些被标注的内容便是语义构建系统的内容,所以它是实现资源语义化的基础,董慧等人设计了层叠隐马尔可夫中文分词模型,对历史文献进行了语义信息提取和语义标注。引入了向量空间模型,设计了加权算法和排序算法,对大规模文献的关键词进行了语义标注,再进行关键词的EI检索时用实验证明了语义标注模型和算法的优势;也利用了向量空间模型和聚类模型设计了自动二进制分类算法,长春职称*,挑选了特定的网页进行分析;荆涛、熊荣东等在学22位*中分别研究了自然语言处理技术和基于信息容量的相似度算法,进而提出了针对不同领域的语义标注方法,刘海学提出了一种针对元数据的语义标注方法,利用数据集中己有的语义标注信息自动构建生成元数据。
(3)语义关系EI检索。2009年Payam Barnaghi等人撰文回顾了语义关系EI检索的历史,****早研究语义关系EI检索的是Aleman-MezaB,HalaschekC等人,他们发表了一系列文章讲述概念、文档、网页之间的语义关系也可以作为EI检索的重要内容;另外还有基于语义的多媒体信息EI检索和本体构建技术两个方面的研究。
目前语义信息EI检索的基本思路和技术路线,先后利用概念提取、格式转换、信息整合等技术将资源库存储成本体库,再使用查询优化和语义关联等技术把本体库中的信息显现在用户眼前。这里提到的概念提取、格式转换和信息整合是通过语义标注实现的,查询优化和语义关联则是依靠基于本体的查询技术和语义关系EI检索实现的。传统信息EI检索一般利用词匹配的结果和排序算法将EI检索集展现给用户,语义信息EI检索的结果则包含了与EI检索结果相关的其他信息,目前数字图书馆的EI检索系统一般实现了表层相关的语义EI检索。比如在某图书馆书目EI检索系统中搜索与《红楼梦》有关的书籍,传统信息EI检索系统只会搜索得到有关《红楼梦》的书籍列表,语义EI检索系统会搜索到《红楼梦》的作者曹雪芹的有关书籍,但却搜索不到与《红楼梦》相似的古典小说,或与曹雪芹关联性高的其他作者的书籍。若要实现此类EI检索结果,关键技术是在查询优化和语义关联的研究上,探索新的EI检索模型和EI检索流程。
一是SSCI期刊少,而且几乎全是外国人的期刊;二是社科类的研究,中国人做的能得到世界认可难很多,不像数理化自然科学的研究。
中国的社科发展水平相对自然科学来说弱了点,自然科学在国际上有没有竞争力不清楚,职称*,只知道国内的社科水平比国外差远了。之前有个*上课说过,想到一个内容很好,发现国外几十年前就有了。。。
像以前计算机没有要求SCI毕业的时候,很多博士生到毕业都没有一篇SCI,后来要求SCI毕业,经过这几年的发展,大家掌握了发SCI诀窍,现在几乎每个毕业的人手几篇一作。如果是文科也要求SSCI毕业,那SSCI就容易了,再经过几年,每个博士生
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
SCI和SSCI我都发表过,因为研究的性质是交叉的,所以两类期刊都有涉及,而且很有趣的是,很多期刊是双收录的。就发表的难度感觉上来说,并没有谁比谁难,因为没有考虑影响因子(IF)和期刊排名、学科差异,就没有比较难度的意义。
一般来说,SCI的IF会比较高,而在SCI和SSCI中也有明显的学科差异。拿心理学和语言学来比较,心理学的期刊要比语言学要高。但是是不是心理学的比语言学难发呢?不是的,尽管语言学的IF很低,发表的难度也不亚于很多高影响因子的SCI,因为什么呢?因为发表的*少。我们还要看到,每年语言学*要比心理学*少很多,一是因为语言学期刊本身就少,二是很多语言学期刊都是一年就发20来篇文章,石家庄职称*,比如Speech and Language, Second Language Research, 这两本期刊都是IF一点几,而*科学的Neuroscience Letters,影响因子2点几,一年发表几百篇文章,是*科学的四区,而一点几的语言学期刊是语言学的一区,难度差别可想而知。
同时我们还要看到是否是Open access。很多Open Access期刊比如Plos One,一年发表几千篇*。影响因子也是二点多,和语言学的期刊比较难度也是可想而知。所以,不是说SSCI难发,如果是Open Access的SSCI,相比较还是容易得,比如Frontiers in Psychology。而每个领域的TOP期刊,总归是很难发表的,尽管有的影响因子并不高
我们一部分作者往往愿意引述国外*学者的工作,有点"言必称希腊"的味道,但对国内同行发表的工作重视不够。有时明明是中国学者首先做的工作,都没有得到自己的国内同行的充分评价。较多地并且适当地援引国内同行工作,是应当提倡的。但是,我们也不要学习少数日本作者,他们绝少引用日本学者之外的文章。部分同行在*中引述相当数量公式,但却不列出公式的出处,让读者分不清是作者发展的,还是引自他人以往的工作。原则上,除了教科书上公认的方程和表达式外,对于用于特定目的、特定条件和问题的推演,只要不是作者自己的工作,都要列出出处和适用的条件;即便是作者自己以往的工作,也要列出相应的文献,让读者在必要时参考。 作者在充分评价以往工作的基础上,应当清晰地指出自己在当前工作中的****的贡献。这是作者对科学负责的表现,是一篇好的学术*开宗明义必须写清楚的内容。
要特别重视*的题目、摘要、图表和结论每一位作者都有阅读大量*的经验。读者阅读*的习惯一般是首先浏览目录,只有对题目有兴趣才愿意翻到有关*;对一篇题目有兴趣的*,读者又首先读*摘要;如果对摘要还有兴趣,接着会去看*的图表,因为图表往往清楚地反映了*的结果。看过图表之后,如读者还有兴趣,会接着读*的结论。通常只有少数读者会读*的全文。作者应当清晰地知道,*的题目将被数以千计的读者读到。对题目的每一个字都要审慎地选择,用少的词语确切反映*的内容。
正确对待审稿意见和退稿
国际核心刊物的审稿多是各个领域的*学者。杂志的出版社会经常征询编委的意见,选择优的审稿队伍。审稿是无报酬的。审稿人的工作态度大多****其认真。对审稿意见要十分尊重,对每一条批评和建议,都要认真分析,并据此修改*。对自己认为是不正确的意见,要****其慎重和认真地回答,有理有据地与审稿人探讨。如何对待被杂志拒绝的*,常常是作者犯难的问题。这里必须分析被拒绝的理由。类拒绝是一种"完全的拒绝",主编通常会表达个意见,对这类文章永远不愿再看到,再寄送这类文章是没有意义的。有一类是文章包含某些有用的数据和信息,主编拒绝这类文章是由于数据或分析有严重缺陷。对这类文章作者不妨先放一放,等到找到更广泛的证据支持或有了更明晰的的结论,再将经过修改的"新"文章寄给同一杂志。主编通常是会考虑重新受理这类文章的。
*初稿完成之后,一定要做拼写检查,不出现简单的拼写出错。如果对自己的英文写作无把握,请一位英文好的同事和国外同行把把英文关必要的。为从根本上****我国学者英语水平,我们建议对研究生必须开设英语写作课程。