目前,我个人阅读外文书籍最大的麻烦,就是总遇到各种奇葩的表达。
特别是那些短语动词和习语,真的是见一次骂一次。那些都是什么鬼东西?
每次都要查询词典的话,说实话是真的太麻烦了。于是显而易见的方法,就是用Ai提前将这些麻烦提取出来,提前看看吧。
我说下我目前在用的方法。注意,这些方法可能是会更新的。
切割文档
建议用PDF文档。没办法,PDF文档切割起来比较顺手。你可以用万兴PDF那种用目录进行切割,也可以用PDF24那种粗暴的页码切割。
至于切割的长短,其实主要看你用的模型。对于GPT4 turbo来说,稍微长一些也没事。对于GPT4 8K或者32K,虽然GPT4支持一些文本重构技术,但是也有它的极限。所以你最好不要切割太长的文档给GPT4 。
对GPT4 turbo,这个东西是纯粹的公务员做派,最好也不要弄太长的文档给它,因为它会偷懒只提取部分信息就告诉你事情搞完了。
反正就是多测试,直到你发现长度合适。
将切割好的文档输入模型
这部分没什么好说的了,完全看你平时是怎样用GPT4的。我用的是之前的Bing QT客户端(之前推荐过),那么就利用它上传文档然后选择提示词,等GPT4输出结果就行。
边看边等待
我不建议你一次性提前处理好一本书,那样太麻烦。我建议你就大概处理下你正在看的足够了。
效果截图
提示词
最后附上我写的提示词。根据模型的不同,你最好根据结果调节下。
里面的内容是虚构的,写到B2主要是想让GPT4提取的知识,不过于高级也不过于低级。如果你嫌弃太详细,可以调节下。
核心提示词开始
用户的英语水平大概在B2。
请首先理解用户将附带的英语文章的内容,然后根据用户的英语水平,划定表达难度,将下面文章的陌生单词,固定表达组合,短语动词,习语,成语,专业术语等语块进行提取和解释(只需要解释在这里的意思)。
你的作用,在于替代用户进行资料和词典查证。请不要误以为你是在向用户逐字逐句解释原文。
请全面而详尽的提取其中信息。你的提取应该是有理解能力的,可以识别出在这里的必要性和特殊性。
输出的结果应该符合原文的文章顺序。
对于生词,包含用户这个水平的,母语为汉语的英语使用者所没有见过的词和表达。还包括各种词汇常见,但是意义不常见的表达。
例如,用户较为熟悉的是生活中常见的意思,但是对同一个单词在不同领域的意思不属于一般的生活常见意义,这种表达就需要进行提取。
另外,中文母语者一般学习书面语,对各种日常通俗说法相对于书面语更为陌生,提取它的必要性因此有所提高。对语块(chunk)的说明:你应该提取的是其中出现的各种表达方式,方法,组合,习语,成语等语块内容,这些内容是独立于某篇具体的文章也依然有效的。请不要将原文的逐字逐句的内容理解成用户需要的语块。
对跨越文本的语块的说明:各种固定表达,不应该局限在表达上连接在一起的组合。那些被各种因素隔开的表达也应进行提取。用户将用一个例子说明此处的要求。
对此处说明的例文1:In response to studies that relate high rates of female attrition from biomedical research fields to the obligations of motherhood, researchers concerned about inclusivity are now debating the issue of weekend conference duties.
你应该注意到,其中出现了被隔开的的relate ..to …表达。对此处说明的例文2:Sir James Clark Ross had obtained a sounding of over 2,400 fathoms in 1839, but it was not until 1869, when H.M.S. Porcupine was put at the disposal of the Royal Society for several cruises, that a series of deep soundings was obtained in the Atlantic and the first samples were collected by dredging the bottom.
你应该注意到其中的一个具有广泛应用的表达: not until ..when …,that ..and .
你需要学习这种方法进行提取操作。提取的信息的数目要求:你应该根据文档的内容的输出所有符合规则的结果。再次强调,是所有符合规则的结果。
不要将结果数量锁定在低于30个或者其他任何魔法数字。对于解释的要求:你的解释是用四个部分组合成的。
第一部分:适合此处的权威词典英文解释(由你查找得到的)。此外,你需要给出它的音标和词性。
第二部分:适合此处的权威词典的中文解释(由你查找得到的)。
第三部分:在这里的更灵活的解释(由你生成的)。请不要在这部分给出本文内容外的例句。
第四部分:此处如果涉及到了修辞手法,请将其指出。如果这是一种在特定场景下常见的表达,请将其指出。如果涉及到了典故,请将其指出。如果涉及的表达存在词义联想现象和文化联想意义现象,请将其指出;例如,owl在英国母语文化中联想到了”智慧“,但是在中文联想到了”晦气“,你需要指出这种非母语人士一般不会注意的差异帮助用户理解。请不要给出额外的例句。第四部分不是强制的,而是根据判断可选的。有的时候不需要包含第四部分。输出的结果应该是这样的:
语块:输出第一部分的实际结果。输出第二部分的实际结果。输出第三部分的实际结果。输出可能存在的,第四部分的实际结果。例子1:
语块:precipitously /prɪˈsɪpɪtəsli/ adv. To a dangerously high degree; extremely or immoderately.达到危险的高度地;极度地。在这里用于描述由于智能手机和社交媒体的兴起,人与人之间真实的互动骤然下降。这个副词常用于描述程度之高已达危险或极端的状态。precipitous /prɪˈsɪpɪtəs/ adj.是一个相对高级和正式的词汇,意为”极高的,陡峭的;匆忙仓促的”。
例子2:
语块:central to /ˈsentrəl tuː/ phrase. Of primary importance to.对…至关重要,处于…的中心。在这里指的是公共电话在电影《黑客帝国》情节中的重要作用。这个短语常用于强调某事物对另一事物的重要性或核心地位。
例子3:
语块:find one’s way /faɪnd wʌnz weɪ/ phrase. To successfully navigate a route to a destination, often in a place that is unfamiliar or confusing.找到去往目的地的路,常指在陌生或复杂的环境中成功到达。这里用find our way比喻人们摆脱孤独和技术的束缚,重新找到通往现实世界的道路。这个短语指成功到达目的地,常用于比喻达成目标或摆脱困境。
例子4:
语块:hangs out /hæŋz aʊt/ phrase verb. Spends time relaxing or enjoying oneself in a particular place.在某地消磨时光,闲逛。这里Spy Pet网站用一个口语化的表达”你有没有想过你的朋友在Discord的什么地方闲逛?”,拉近与用户的距离。hang out是一个非正式短语,指随意地待在某个地方,常含有放松享受的意味。你是勤劳的,你是尽责的,你是完美主义的。
请使用中文回答问题,除非有额外说明。
现在你需要输出之前的提取出来的内容。请在完成输出最后以“THE END”结尾。
英语文章开始:
核心提示词结束
可选译文部分开始
请在完成输出提取的内容之后,对文章进行分析,但是只将分析输出到 #inner_monologue 。
然后,根据之前分析的结果输出一份准确但是较为流畅的译文,译文只需要进行部分的调节符合中文表达语序。
请在完成输出最后以“THE END”结尾。译文部分提示词结束
请根据需要手动搭配以上三个部分。
提示词2,用在让模型继续:
请继续提取至少50个没有包含在你之前输出的信息。
点评
这里的让模型继续提取50个只是个概数,模型并不是真的会输出50个信息出来。根据经验,GPT4 turbo模型,几乎每次都需要这样说才会较为完整的完成任务。
PS:
我建立了一个QQ群:836665016