文献信息检索 + 文献阅读
在专业上和我们初步想的是不一致的。
直检法:专业核心期刊跟踪
常规法: 顺查法, 倒查法, 抽查法
追溯法: 参考文献, 引用目录
综合法: 分段法, 循环法, 交替法
描述检索系统中信息特征与表达用户信息提问的一种专门语言.
人工语言 Artificial Language 规范
标题词语言 Subject Heading
单元词语言 Uniterm
叙词语言 Descriptor
关键词语言 Keyword
之四
邹承鲁院士写他是如何读文献的:
无论题目从何而来,都必需紧密追踪当前有关科学领域发展的动向。从研究生时代开始,在导师 教导下,以周围同学为榜样,我就养成了每周必定去图书馆浏览最新期刊的习惯,几十年如一日,雷打不动。如果确实有事,下周必定补上。我当时有一个小记录册,登录所有对本专业重要的刊物,每期读过后,一定做记录,决不遗漏一期,直至今日。现在可以在网上阅读所有重要刊物的目录和摘要,这就更容易做到了。掌握文献、对文献进行综合,以批判的眼光评价文献,并从中提取出有用的和正确的信息以指导今后的研究是一个能独立工作的科学工作者必备的能力。
阅读文献以追踪当前发展动态时,务须切记发挥自己判断力,不可盲从,即使是知名科学家和教科书有时也会有错误。古人说得好:“ 尽信书不如无书”。在追踪当前发展的重要方向时切记,你看到的问题别人也同样会看到,越是重要的问题竞争必然越是剧烈,在研究条件不如人时,如果没有创新的研究思想,独到的研究方案是不可能超越他人得到成功的。虽然国际上也有对于某些重要课题一哄而起的情况,但在我国似乎特别严重。缺乏自己的创新思想而片面一哄而起追求热点,是一条必然失败的路线,最多只能是为别人成果锦上添花,或做一些小修小补的工作而已。关键在于自己的创新思想。创新思想来自何处,虽然灵机一动产生了重要的创新思想,在科学史上确实有所记载,但这毕竟是比较罕见的,而远远更为常见的是天才出于勤奋,创新出于积累,积累可以是个人积累,也可以是本人所在单位的长期积累。这就是前面提到的旺火炉原理,也是诺贝尔奖经常出在少数几个单位的原因。只有勤奋努力才能不断有优秀工作的积累,才可能在工作中逐渐产生真正创新的,别人无法剽窃的创新思想,才有可能在重大问题上取得突破。而在一个炉火熊熊的旺火炉中,不断会有优秀工作的积累,优秀人才的产生,并且创新思想和人才的不断相互作用,相互启发,相互激励,就会不断创造出新的突破性成果。
之五:
MIT人工智能(AI)实验室的教授和学生总结的如何读论文,还不错!
阅读论文是需要练习的技能。不可能完整地阅读所有的论文。
阅读论文可分为三个阶段:
第一阶段是看论文中是否有感兴趣的东西。AI论文含有摘要,其中可能有内容的介绍,但是也有可能没有或者总结得不好,因此需要你跳读,这看一点那看一点,了解作者究竟做了些什么。内容目录(the table of contents)、结论部分(conclusion)和简介(introduction)是三个重点。如果这些方法都不行,就只好顺序快速浏览了。一旦搞清楚了论文的大概和创新点,就可以决定是否需要进行第二阶段了。
在第二阶段,要找出论文真正具有内容的部分。很多15页的论文可以重写为一页左右的篇幅;因此需要你寻找那些真正激动人心的地方,这经常隐藏于某个地方。论文作者从其工作中所发现的感兴趣的地方,未必是你感兴趣的,反之亦然。
最后,如果觉得该论文确实有价值,返回去通篇精读。 读论文时要牢记一个问题,“我应该如何利用该论文?”“真的像作者宣称的那样么?”“如果……会发生什么?”。理解论文得到了什么结论并不等同于理解了该论文。理解论文,就要了解论文的目的,作者所作的选择(很多都是隐含的),假设和形式化是否可行,论文指出了怎样的方向,论文所涉及领域都有哪些问题,作者的研究中持续出现的难点模式是什么,论文所表达的策略观点是什么,诸如此类。
之六
1.多数文章看摘要,少数文章看全文 掌握了一点查全文的技巧,往往会以搞到全文为乐,以至于没有时间看文章的内容,更不屑于看摘要。真正有用的全文并不多,过分追求全文是浪费,不可走极端。当然只看摘要也是不对的。
2.集中时间看文献 看过总会遗忘。看文献的时间越分散,浪费时间越多。集中时间看更容易联系起来,形成整体印象。
3.做好记录和标记
复印或打印的文献,直接用笔标记或批注。pdf 或html 格式的文献,可以用编辑器标亮或改变文字颜色。这是避免时间浪费的又一重要手段。否则等于没看。 4.准备引用的文章要亲自看过。转引造成的以讹传讹不胜枚举。5.注意文章的参考价值。刊物的影响因子、文章的被引次数能反映文章的参考价值。但要注意引用这篇文章的其它文章是如何评价这篇文章的:支持还是反对,补充还是纠错
下面全部摘自 台湾清华大学彭明辉教授的研究生指导手册
六、论文阅读的补充说明
硕士生开始学读期刊论文时,就容易犯的毛病就是戒除不掉大学部的习惯:(1)老是想逐行读懂,有一行读不懂就受不了。(2)不敢发挥自己的想象,读论文像在读教科书,论文没写的就不会,瘫痪在那里;被我逼着去自己猜测或想象时,老怕弄错作者的意思,神经绷紧,脑筋根本动不了。大学毕业后(不管是念硕、博士或工作),可以参考的资料都没有秩序地交错成一团,而且永远都读不完。用大学生的心态读书,结果一定时间永远不够用。因此,每次读论文都一定要带着问题去读,每次读的时候都只是图回答你要回答的问题。 因此,一定是选择性地阅读,一定要逐渐由粗而细地一层一层去了解。上面所规划的读论文的次序,就是由粗而细,每读完一轮,你对这问题的知识就增加一层。根据这一层知识就可以问出下一层更细致的问题,再根据这些更细致的问题去重读,就可以理解到更多的内容。因此,一定是一整批一起读懂到某个层次,而不是逐篇逐篇地整篇一次读懂。
这样读还有一个好处:第一轮读完后,可以根据第一轮所获得的知识判断出哪些论文与你的议题不相关,不相关的就不需要再读下去了。这样才可以从广泛的论文里逐层准确地筛选出你真正非懂不可的部分。不要读不会用到的东西,白费的力气必须被极小化!
其实,绝大部分论文都只需要了解它的主要观念(这往往比较容易),而不需要了解它的详细推导过程(这反而比较费时)。 其次,一整批一起读还有一个好处:同一派的观念,有的作者说得较易懂,有的说得不清楚。整批读略过一次之后,就可以规划出一个你以为比较容易懂的阅读次序,而不要硬碰硬地在那里撞墙壁。你可以从甲论文帮你弄懂以论文的一个段落,没人说读懂甲论文只能靠甲论文的信息。所以,整批阅读很像在玩跳棋,你要去规划出你自己阅读时的「最省力路径」。
大学部学生读东西一定要循规蹈矩,你还没修过机械视觉相关课程之前可能也只好循规蹈矩地逐行去念。但是一旦修过机械视觉相关课程,许多论文中没被交代的段落你也已经可以有一些属于你的想象(虽然有可能猜错,尤其刚开始时经常猜错,但没关系,下面详述)。这些想象往往补足论文跳跃处最快速的解决方案。其实,一个大学毕业生所学已经很多了,对许多是都可以有一个不太离谱的想象能力。但是大部分学生却根本不敢去想象。我读论文远比学生快,分析远比学生深入,主要的是我敢想象与猜测,而且多年训练下来想象与猜测的准确度很高。所以,许多论文我根本不是读懂的,而是猜对了!假如猜错了怎么办?不用怕!猜完以后要根据你的猜测在论文里找证据,用以判断你的猜测对不对。猜对了,就用你的猜测(其实是你的推理架构)去吸收作者的资讯与创意(这会比从头硬生生地去迁就作者的思路轻松而容易);猜错了,论文理会有一些信息告诉你说你错了,而且因为猜错所以你读到对的答案时反而印象更深刻。
三、为什么要坚持培养阅读与分析期刊论文的能力
我所以一直坚持要训练研究生阅读与分析期刊论文的能力,主要是为了学生毕业后中长期的竞争力着想。 台湾从来都只生产国外已经有的产品,而不事创新。假如国外企业界比国外学术的技术落后三年,而台湾的技术比国外技术落后五年,则台湾业界所需要的所有技术都可以在国外学术期刊上找到主要的理论依据和技术核心构想(除了一些技术的细节和 know how 之外)。因此,阅读期刊的能力是台湾想要保持领先大陆技术的必备条件。此外,只要能够充分掌握阅读与分析期刊论文的技巧,就可以水到渠成地轻松进行“创新”的工作。所以,只要深入掌握到阅读与分析期刊论文的技巧,就可以掌握到大学生不曾研习过的三种能力:
(1)自己从无组织的知识中检索、筛选、组织知识的能力、
(2)对一切既有进行精确批判的独立自主判断能力、
(3)创造新知识的能力。
创新的能力在台湾一直很少被需要(因为台湾只会从国外买整套设备、制程和设计与制造的技术)。但是,大陆已经成为全球廉价品制造中心,而台商为了降低成本也主动带技术到大陆设厂(包括现在的晶元代工),因此整个不具关键性技术的制造业都会持续往大陆移动;甚至 IC 的设计(尤其数字的部分)也无可避免地会迅速朝向“台湾开系统规格,进行系统整合,大陆在前述架构下开发特定数位模块”的设计代工发展。因此,未来台湾将必然会被逼着朝愈来愈创意密集的创意中心走(包括商务创意、经营创意、产品创意、与技术创新)。因此,不能因为今天台湾的业界不需要创新的能力,就误以为自己一辈子都不需要拥有创新的能力。
我在协助民间企业发展技术研发的过程中,碰到过一位三十多岁的厂长。他很聪明,但从小家穷,被环境逼着去念高工,然后上夜校读完工专。和动态性能(bandwidth、response speed等)无关的技术他都很深入,也因为产品升级的需要而认真向我求教有关动态性能的基本观念。但是,怎么教他都不懂,就只因为他不懂工程数学。偏偏,工程数学不是可以在工厂里靠自修读会的。一个那么聪明的人,只因为不懂工数,就注定从三十岁以后一辈子无法在专业上继续成长!他高工毕业后没几年,廿多岁就当课长,家人与师长都以他为荣;卅岁当厂长,公司还给他技术股,前途无量;谁想得到他会在卅岁以后被逼着「或者升级,或者去大陆,或者失业?每次想起这位厂长,看着迫不急待地要到台积电去七年赚两千万退休金」的学生,或者只想学现成可用的技术而不想学研究方法的学生,我总忍禁不住地要想:十年后,我教过的学生里,会不会有一堆人就只因为不会读期刊论文而被逼提前退休?
再者,技术的创新并不是全靠聪明。我熟谙一套技术创新的方法,只要学会分析期刊论文的优缺点,就可拿这套方法分析竞争对手产品的优缺点;而且,只要再稍微加工,就可以从这套优缺点的清单里找到突破瓶颈所需的关键性创意。这套创新程序,可以把“创新”变成不需要太多天分便可以完成的事,从而减轻创意的不定性与风险性。因此,只要会分析论文,几乎就可以轻易地组合出你所需要的绝大部分创意。聪明是不可能教的,但这套技巧却是可以教的;而且只要用心,绝大部分硕士生都可以学会。就是因为这个原因,我的实验室整个训练的重心只有一个:通过每周一次的 groupmeeting,培养学生深入掌握阅读与分析期刊论文的技巧,进而培养他们在关键问题上突破与创新的能力。
四、期刊论文的分析技巧与程序一般来讲,好的期刊论文有较多的创意。
虽然读起来较累,但收获较多而深入,因此比较值得花心思去分析。读论文之前,参考SCI Impact Factor 及学长的意见是必要的。一篇期刊论文,主要分成四个部分。
(1)Abstract: 说明这篇论文的主要贡献、方法特色与主要内容。最慢硕二上学期必须要学会只看Abstract 和Introduction便可以判断出这篇论文的重点和你的研究有没有直接关连,从而决定要不要把它给读完。假如你有能力每三十篇论文只根据摘要和简介便能筛选出其中最密切相关的五篇论文,你就比别人的效率高五倍以上。以后不管是做事或做学术研究,都比别人有能力从更广泛的文献中挑出最值得参考的资料。
(2)Introduction: Introduction 的功能是介绍问题的背景和起源,交代前人在这个题目上已经有过的主要贡献,说清楚前人留下来的未解问题,以及在这个背景下这篇论文的想解决的问题和它的重要性。对初学的学生而言,从这里可以了解以前研究的概况。通常我会建议初学的学生,对你的题目不熟时,先把跟你题目可能相关的论文收集个30~40篇,每篇都只读Abstract 和 Introduction,而不要读 Main Body(本文),只在必要时稍微参考一下后面的 Illustrative examples和 Conclusions,直到你能回答下面这三个问题:
(2A)在这领域内最常被引述的方法有哪些?
(2B)这些方法可以分成哪些主要派别?
(2C)每个派别的主要特色(含优点和缺点)是什么?问题是,你怎么去找到这最初的30~40篇论文?有一种期刊论文叫做“review paper”,专门在一个题目下面整理出所有相关的论文,并且做简单的回顾。你可以在搜寻 Compendex 时在 keywords 中加一个“review”而筛选出这类论文。然后从相关的数篇review paper 开始,从中根据 title 与 Abstract 找出你认为跟你研究题目较相关的30~40篇论文。
通常只要你反复读过该领域内30~40篇论文的Abstract 和 Introduction,你就应该可以从Introduction的评论中回答(2A)和(2B)这两个问题。尤其要记得,当你阅读的目的是要回答(2A)和(2B)这两个问题时,你一定要先挑那些Introduction写得比较有观念的论文念(很多论文的Introduction 写得像流水帐,没有观念,这种论文刚开始时不要去读它)。假如你读过假如30~40篇论文的Abstract 和 Introduction之后,还是回答不了(2C),先做下述的工作。你先根据(2A)的答案,把这领域内最常被引述的论文找齐,再把他们根据(2B)的答案分成派别,每个派别按日期先后次序排好。然后,你每次只重新读一派的Abstract 和 Introduction(必要时简略参考内文,但目的只是读懂Introduction内与这派有关的陈述,而不需要真的看懂所有内文),照日期先后读,读的时候只企图回答一个问题:这一派的创意与主要诉求是什么?这样,你逐派逐派地把每一派的Abstract 和 Introduction 给读完,总结出这一派主要的诉求、方法特色和优点(每一篇论文都会说出自己的优点,仔细读就不会漏掉)。
其次,你再把这些论文拿出来,但是只读Introduction,认真回答下述问题:“每篇论文对其它派别有什么批评?”然后你把读到的重点逐一记录到各派别的“缺点”栏内。 通过以上程序,你就应该可以掌握到(2A)、(2B)、和(2C)三个问题的答案。这时你对该领域内主要方法、文献之间的关系算是相当熟捻了,但是你还是只仔细读完Abstract 和 Introduction而已,内文则只是笼统读过。这时候,你已经掌握到这领域主要的论文,你可以用这些论文测试看看你用来搜寻这领域论文的 keywords 到底恰不恰当,并且用修正过的 keywords 再搜寻一次论文,把这领域的主要文献补齐,也把原来30~40篇论文中后来发现关系较远的论文给筛选掉,只保留大概20篇左右确定跟你关系较近的文献。如果有把握,可以甚至删除一两个你不想用的派别(要有充分的理由),只保留两、三个派别(也要有充分的理由)继续做完以下工作。然后你应该利用(2C)的答案,再进一步回答一个问题(2D):“这个领域内大家认为重要的关键问题有哪些?有哪些特性是大家重视的优点?有哪些特性是大家在意的缺点?这些优点与缺点通常在哪些应用场合时会比较被重视?在哪些应用场合时比较不会被重视?”然后,你就可以整理出这个领域(研究题目)主要的应用场合,以及这些应用场合上该注意的事项。
最后,在你真正开始念论文的 main body 之前,你应该要先根据(2A)和(2C)的答案,把各派别内的论文整理在同一个档案夹里,并照时间先后次序排好。然后依照这些派别与你的研究方向的关系远近,一个派别一个派别地逐一把各派一次念完一派的 main bodies。
(3)Main body(含simulation and/or experimental examples): 在你第一次有系统地念某派别的论文 main bodies 时,你只需要念懂:
(3A)这篇论文的主要假设是什么(在什么条件下它是有效的),并且评估一下这些假设在现实条件下有多容易(或多难)成立。愈难成立的假设,愈不好用,参考价值也愈低。
(3B)在这些假设下,这篇论文主要有什么好处。
(3C)这些好处主要表现在哪些公式的哪些项目的简化上。至于整篇论文详细的推导过程,你不需要懂。除了三、五个关键的公式(最后在应用上要使用的公式,你可以从这里评估出这个方法使用上的方便程度或计算效率,以及在非理想情境下这些公式使用起来的可靠度或稳定性)之外,其它公式都不懂也没关系,公式之间的恒等式推导过程可以完全略过去。假如你要看公式,重点是看公式推导过程中引入的假设条件,而不是恒等式的转换。 但是,在你开始根据前述问题念论文之前,你应该先把这派别所有的论文都拿出来,逐篇粗略地浏览过去(不要勉强自己每篇或每行都弄到懂,而是轻松地读,能懂就懂,不懂就不懂),从中挑出容易念懂的 papers,以及经常被引述的论文。然后把这些论文照时间先后次序依序念下去。记得:你念的时候只要回答(3A)、(3B)、(3C)三个问题就好,不要念太细。这样念完以后,你应该把这一派的主要发展过程,主要假设、主要理论依据、以及主要的成果做一个完整的整理。其次,你还要在根据(2D)的答案以及这一派的主要假设,进一步回答下一个问题:
(3D)这一派主要的缺点有哪些。最后,根据(3A)、(3B)、(3C)、(3D)的答案综合整理出:这一派最适合什么时候使用,最不适合什么场合使用。记住:回答完这些问题时,你还是不应该知道恒等式是怎么导出来的! 当你是生手的时候,你要评估一个方法的优缺点时,往往必须要参考它的Examples。但是,要记得:老练的论文写作高手会故意只 present 成功的案例而遮掩失败的案例。所以,simulation examples and/or experiments 很棒不一定表示这方法真的很好。你必须要回到这个方法的基本假设上去,以及他在应用时所使用的主要公式(resultant equations)去,凭自己的思考能力,并且参考(2C)和(2D)的答案,自己问问看:当某某假设在某些实用场合上无法成立时,这个方法会不会出什么状况?猜一猜,预测一下这个方法应该会在哪些条件下(应用场合)表现优异,又会在哪些条件下(应用场合)出状况?根据这个猜测再检验一次simulation examples and/or experiments,看它的长处与短处是不是确实在这些examples 中充分被检验,且充分表现出来。 那么,你什么时候才需要弄懂一篇论文所有的恒等式推导过程,或者把整篇论文细细读完?NEVER!你只需要把确定会用到的部分给完全搞懂就好,不确定会不会用到的部分,只需要了解它主要的点子就够了。硕士生和大学生最主要的差别:大学生读什么都必须要从头到尾都懂,硕士生只需要懂他用得着的部分就好了!大学生因为面对的知识是有固定的范围,所以他那样念。硕士生面对的知识是没有范围的,因此他只需要懂他所需要的细腻度就够了。硕士生必须学会选择性的阅读,而且必须锻炼出他选择时的准确度以及选择的速度,不要浪费时间在学用不着的细节知识!多吸收「点子」比较重要,而不是细部的知识。