提取英语文章的语块和生词加速阅读

目前,我个人阅读外文书籍最大的麻烦,就是总遇到各种奇葩的表达。

特别是那些短语动词和习语,真的是见一次骂一次。那些都是什么鬼东西?

每次都要查询词典的话,说实话是真的太麻烦了。于是显而易见的方法,就是用Ai提前将这些麻烦提取出来,提前看看吧。

我说下我目前在用的方法。注意,这些方法可能是会更新的。

切割文档

建议用PDF文档。没办法,PDF文档切割起来比较顺手。你可以用万兴PDF那种用目录进行切割,也可以用PDF24那种粗暴的页码切割。

至于切割的长短,其实主要看你用的模型。对于GPT4 turbo来说,稍微长一些也没事。对于GPT4 8K或者32K,虽然GPT4支持一些文本重构技术,但是也有它的极限。所以你最好不要切割太长的文档给GPT4 。

对GPT4 turbo,这个东西是纯粹的公务员做派,最好也不要弄太长的文档给它,因为它会偷懒只提取部分信息就告诉你事情搞完了。

反正就是多测试,直到你发现长度合适。

将切割好的文档输入模型

这部分没什么好说的了,完全看你平时是怎样用GPT4的。我用的是之前的Bing QT客户端(之前推荐过),那么就利用它上传文档然后选择提示词,等GPT4输出结果就行。

边看边等待

我不建议你一次性提前处理好一本书,那样太麻烦。我建议你就大概处理下你正在看的足够了。

效果截图

提示词

最后附上我写的提示词。根据模型的不同,你最好根据结果调节下。

里面的内容是虚构的,写到B2主要是想让GPT4提取的知识,不过于高级也不过于低级。如果你嫌弃太详细,可以调节下。

 

 

核心提示词开始

我的英语水平大概在B2。

请首先理解我将附带的英语文章的内容,然后根据我的英语水平,划定表达难度,将下面文章的陌生单词,固定表达组合,短语动词,习语,成语,专业术语等语块进行提取和解释(只需要解释在这里的意思)。

你的作用,在于替代我进行资料和词典查证。请不要误以为你是在向我逐字逐句解释原文。

请全面而详尽的提取其中信息。你的提取应该是有理解能力的,可以识别出在这里的必要性和特殊性。

输出的结果应该符合原文的文章顺序。

对于生词,包含我这个水平的,母语为汉语的英语使用者所没有见过的词和表达。还包括各种词汇常见,但是意义不常见的表达。
例如,我较为熟悉的是生活中常见的意思,但是对同一个单词在不同领域的意思不属于一般的生活常见意义,这种表达就需要进行提取。
另外,中文母语者一般学习书面语,对各种日常通俗说法相对于书面语更为陌生,提取它的必要性因此有所提高。

对语块(chunk)的说明:你应该提取的是其中出现的各种表达方式,方法,组合,习语,成语等语块内容,这些内容是独立于某篇具体的文章也依然有效的。请不要将原文的逐字逐句的内容理解成我需要的语块。

对跨越文本的语块的说明:各种固定表达,不应该局限在表达上连接在一起的组合。那些被各种因素隔开的表达也应进行提取。我将用一个例子说明此处的要求。
对此处说明的例文1:In response to studies that relate high rates of female attrition from biomedical research fields to the obligations of motherhood, researchers concerned about inclusivity are now debating the issue of weekend conference duties.
你应该注意到,其中出现了被隔开的的relate ..to …表达。

对此处说明的例文2:Sir James Clark Ross had obtained a sounding of over 2,400 fathoms in 1839, but it was not until 1869, when H.M.S. Porcupine was put at the disposal of the Royal Society for several cruises, that a series of deep soundings was obtained in the Atlantic and the first samples were collected by dredging the bottom.
你应该注意到其中的一个具有广泛应用的表达: not until ..when …,that ..and .
你需要学习这种方法进行提取操作。

提取的信息的数目要求:你应该根据文档的内容的输出所有符合规则的结果。再次强调,是所有符合规则的结果。
不要将结果数量锁定在低于30个或者其他任何魔法数字。

对于解释的要求:你的解释是用四个部分组合成的。

第一部分:适合此处的权威词典英文解释(由你查找得到的)。此外,如果是单词,你需要给出它的音标和词性,如果是短语不需要给出音标和词性。

第二部分:适合此处的权威词典的中文解释(由你查找得到的)。
第三部分:在这里的更灵活的解释(由你生成的)。请不要给出额外的例句。
第四部分:此处如果涉及到了修辞手法,请将其指出。如果这是一种在特定场景下常见的表达,请将其指出。如果涉及到了典故,请将其指出。如果涉及的表达存在词义联想现象和文化联想意义现象,请将其指出;例如,owl在英国母语文化中联想到了”智慧“,但是在中文联想到了”晦气“,你需要指出这种非母语人士一般不会注意的差异帮助用户理解。请不要给出额外的例句。

输出的结果应该是这样的:
语块:输出第一部分的实际结果。输出第二部分的实际结果。输出第三部分的实际结果。输出第四部分的实际结果。

例子1:
语块:**proactive** /prəʊˈæktɪv/ adj. (of a person or action) creating or controlling a situation rather than just responding to it after it has happened. (人或行为)主动的,先发制人的。在这里指的是主角在故事中有自己的目标和计划,而不是被动地应对事态。
例子2:
语块:**open loop**。A system where the control action is independent of the “output”.控制动作与“输出”无关的系统。这里指的是故事留下了未完成的事务,使读者的大脑感到悬念。
例子3:
语块:**run anywhere from**。To have a range that extends from one specified extreme to another.范围从…到…。在这里,“run”用于描述一个“Proactive Scene”(积极主动的场景)的长度可能在几百到几千字之间。这是一种表达范围的常见说法。

以上3个例子,分别展现了单词,短语的实例。例子1和例子2不包含第四个部分。例子3包含第四个部分——这是一种表达范围的常见说法。

你是勤劳的,你是尽责的,你是完美主义的。

请使用中文回答问题,除非有额外说明。
现在你需要输出之前的提取出来的内容。

请在完成输出最后以“THE END”结尾。

英语文章开始:

核心提示词结束

 

可选译文部分开始

请在完成输出提取的内容之后,对文章进行分析,但是只将分析输出到 #inner_monologue 。
然后,根据之前分析的结果输出一份准确但是较为流畅的译文,译文只需要进行部分的调节符合中文表达语序。
请在完成输出最后以“THE END”结尾。

译文部分提示词结束

请根据需要手动搭配以上三个部分。

 

提示词2,用在让模型继续:

请继续提取至少50个没有包含在你之前输出的信息。

点评

这里的让模型继续提取50个只是个概数,模型并不是真的会输出50个信息出来。根据经验,GPT4 turbo模型,几乎每次都需要这样说才会较为完整的完成任务。

 

PS:

我建立了一个QQ群:836665016


已发布

分类

来自

标签:

评论

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据