给点提示,就可以自动续写故事!NLP最强文本生成模型GPT
写作应该是给点提示各行各业,各种职业都会用到的可自基础技能。
虽为基础技能,动续但要做好却不难简单,写故想必你一定经历过深夜论文没灵感、事N生成合作方案写不出来这些类似的最强痛苦。如果这个时候能有一个什么都懂的文本全能大神指点迷津,或者直接完成,模型那简直再好不过了!给点提示
最近一位Twitter网友在体验了一款AI神器后,可自发现愿望竟然真的动续实现了!
“百科全书式”写作助手
这款AI神器正是写故Open AI开发的GPT-3自然语言处理模型。简单来说,事N生成GPT-3是最强一款AI文本生成器,它可以根据上文提示,文本自动补齐下文。官方说法是,这款GPT-3涵盖了1750亿个参数,远超GPT-2和其他AI文本生成模型,达到了目前的最佳SOTA,而且其写作水平能够与人类媲美。
但是实际效果如何,咱谁也没用过。可能是出于对产品的自信,两个月前,OpenAI将这款耗费了1200万美元的商用GPT-3模型,对外开源了,现在人人皆可拿来作为自己的写作助手。
最近一位名为Delian的网友在体验完之后,忍不住在Twitter分享了令他难以置信的使用效果。Delian是家风投公司创始人,他希望GPT-3能在“如何召开有效的董事会会议?”的问题上给出一些建议,因此,他针对这个问题,在GPT-3中输入了上文:
内容大意是:公司创始人前期打造一支高质量的董事会成员对于公司初期发展至关重要。而大多说创始人没有意识到这一点。他建议公司在完成A轮融资后就可以开始招募董事会成员,而且招募对象一定好涵盖公司所在领域的各个方向的专家。另外,他还举了一个实例进行了论证了这个观点。
可以看出,上文内容属于商业运营和投资范畴,若非专业人员很难给出相应的回应。
但是,接下来GTP-3生成的下文让他非常满意。(话题涉及主观看法,暂不论对错)
以下是翻译内容:
内容概要:GPT-3首先肯定了稳定高质量的董事会成员对公司发展的价值,然后对如何执行招聘董事会成员的工作给出了具体建议,首先是确定需要招聘的人员清单。
目标清单:从自己身边的同事或朋友入手,招展人脉资源,确定符合需要的目标人选(大约20-25人)
资格清单:建立人员筛选标准,提出一些专业问题、个人生活问题,根据回答判断与公司需求的匹配度。
确定好之后,接下来便是召集现有的董事会成员开始招聘工作。在这里需要保持热情沟通,呈现公司价值。
对于GPT-3呈现出的结果,Delian表示远超出了预期。可以看出,首先模型基本理解了上文大意,并且在无其他提示的情况下,给出了非常详细的意见和建议,虽然并非完全正确,但问题本身也是开放性的问题。同时,下文也基本遵循了上文的格式,如分段和主标题样式。
另外,经过多项测试后,Delina发现任何领域的专业问题,它都能自动生成相互匹配的下文,比如有关同性恋故事的剧本,行业专家的技术访谈、或者有关选举的政治话题等统统不在话下。
Delin还把如此强大的GTP-3形容为:
如果iPhone的出现,是将全世界的知识装进了您的口袋,那么GPT-3则为你提供了10,000个,能够与你在任何话题上交流的博士。
听着非常心动了,每天为文案熬秃头的朋友们,可以来尝试体验一下,为你们奉上开源地址,Github地址:https://github.com/openai/gpt-3
GPT-3:超大模型,无需微调
其实,GPT-3的出色性能还不知如此。这个版本的模型是在今年的五月份刚刚被推出,与之前的GPT-2本相比,它在参数上高出了100倍。更重要的是,GPT-3实现了无需微调的最佳SOTA。
一般来说,GPT自然语言模型工作分为上游预训练和下游特定任务两个主要阶段。无需微调,意味着在经过大型语料库的预训练后,GPT-3在处理诸如语言翻译、完型填空、文本生成等常见NLP任务时,无需针对下游任务作出特殊处理。
同时,它也意味着其处理任务的性能表现,主要取决于它的预训练过程。
首先从预训练阶段的模型大小来看,从论文中的数据显示,在经过几项简单的任务训练(删除文本中的随机符号)后,模型越大学习曲线越陡峭,而越是陡峭,代表学习性能越强。因此,可以说下游任务的学习能力主要由模型大小决定。
在GPT-3中的模型和体系架构与GPT-2基本一致,包括其中描述的修改后的初始化,预规范化和可逆记号化,不同之处在于,在GPT-3各层中使用了Sparse Transformer架构 。同时,研究人员训练了8种不同大小的模型,范围从1.25亿个参数到1,750亿个参数,三个数量级。最后一个为“GPT-3”。
可以看出,模型越大,它在可训练总数、层级数、学习比率方面的表现越高。
另外,从语料库来讲,模型越大越需要大的语料库作为支撑,GPT-3采用的数据集(Common Crawl)包含了近一万亿个单词。
CommonCrawl数据是从2016年到2019年,每个月的CommonCrawl的41个分片中下载的,构成了过滤前的45TB压缩明文和过滤后的570GB,大致相当于4000亿字节。
请注意,在训练过程中,并非按大小对数据集进行采样,而是较高质量的数据集采样频率更高,因此,在训练过程中CommonCrawl和Books2数据集采样的次数少于一次,而其他数据集则采样了2 -3次。这本质上是接受了少量的过度拟合,换取了更高质量的训练数据。
因此,基于超大模型和与数据库的GPT-3在预训练阶段能够表现出极好的性能。
存在一定的局限性
不过,从此前的测试中,我们也可以看出GPT-3的文本生成还是存在一些局限性的。具体我们可以从Q&A问答中来看一下。对于常识性性问题,GPT-3还是非常擅长的。如,
GPT-3自身的学习经验主要是从网上抓取,因此在回答一些常识性问题时,它可以从网上找到准确的对应答案。但在处理对于一些“不言而喻”的问题时,它就可以出现错误,比如下文:
Q:烤面包机和铅笔哪一个较重?
A:铅笔比烤面包机重。
虽然在这些问题上存在缺陷,不过,GPT-2在处理一些逻辑性问题,或者阅历理解任务时,几乎可以达到人类的水平。因此,在很多方面可以作为人类很好的辅助工具。
相关链接:雷锋网雷锋网雷锋网
论文地址:https://arxiv.org/abs/2005.14165
https://delian.substack.com/p/quick-thoughts-on-gpt3
https://lambdalabs.com/blog/demystifying-gpt-3/
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
36
-
浏览
911
-
获赞
7211
热门推荐
-
Nike 降落伞系列鞋款完整版曝光,庆祝 Air Max Day!
潮牌汇 / 潮流资讯 / Nike 降落伞系列鞋款完整版曝光,庆祝 Air Max Day!2020年03月24日浏览:4020 本周四3 月 26 日)就将迎来一年一安徽空港信息技术有限公司免费为客户机场换代更新中小机场空管综合信息处理系统
5月10日,安徽空港信息技术有限公司完成对义乌机场空管综合信息处理系统免费更新。至此,该公司已先后完成上饶三清山机场、黄山屯溪国际机场等3家客户机场的系统更新。用上新版系统的3家机场空管部门均表示,赤峰机场查获隐匿火柴
赤峰机场查获隐匿火柴 5月13日,赤峰玉龙机场查获一起旅客隐匿携带火柴事件。 上午11点53分,2号安检阿尔山分公司航务保障部召开三基建设专项汇报会
5月13日,阿尔山分公司航务保障部召开三基建设专项汇报会,阿尔山分公司副总经理李德奎、分公司职能部门相关人员、航务保障部全体员工参加了会议。 为了夯实航务保障部三基基础,坚守机场安全运行从进博会到“双11” 双平台共振展现中国市场热力
进博好物上架“双11”,包邮区扩容至偏远地区以及境外多地……日前闭幕的第七届中国国际进口博览会上,参展商携手跨境电商平台,纷纷开启直播模式,秀首展、弟弟赵光义要干掉赵匡胤是为了继承皇位吗
在中国的封建历史中,象征着至高无上权力的皇帝的位置一般是由上一位皇帝传给自己的子嗣的,而且这个子嗣一般的要求的是嫡长子,这就是著名的“嫡长子继承制“。千百年这个规矩几乎很少被打破过。不过凡事总会有例外楚文王冲冠一怒为红颜是“吃套路”了吗?
约公元前690年,在父亲楚武王去世后,楚文王顺利继承王位。俗话说的好,新官上任三把火,楚文王在即位后不久,决定让动一动自己都城,也即将都城搬迁到郢都。迁都之后的第二年,楚文王想要吞并弱小的申国。不过,诸葛亮所犯的这些错误其实个个都是致命的!
人无完人,诸葛亮虽多智而近妖,帮助刘备三分天下得其一,但始终没有一统三国。除了无天时无地利外,与他本身所犯的几大错误也有很大的关系。而这些错误对蜀汉来说,无疑都是致命的。错误之一:占荆州诸葛亮坚持联吴药机展CIPM盛幕将启 艾伊科技携创新产品蓄势待发
【化工仪器网 展会报道】作为制药生产过程中的重要支撑,制药机械在提高生产效率、保障药品质量、推动技术创新等方面发挥着重要作用。近年来,随着全球医药市场规模的扩大和市场需求的变化,制药机械行业也在不断探防疫生产两不误——黑龙江空管分局完成A
2020年5月13日,黑龙江空管分局顺利完成了A-SMGCS系统场面活动引导与控制系统)的升级工作。厂家工程师到达哈尔滨现场后,分局立即召开了升级研讨会,由技术保障部、管制运行部和厂家工程师三方人员参刘备宠臣刘琰 历史上因为打老婆被处死的人
皇宫是一个奇特的地方,因为其与外界隔绝,被称之为禁城。不过,这宫苑禁地历来都是个出烂事的地方,无论是开国之初的政治清明时期,还是战乱岁月的危机四伏年代都概莫能外。这不,在三国时期的蜀汉国,就出了这么一极具杀伤力环首刀的刀环是起到了什么作用
环首刀是中国历史上著名的冷兵器。由于环首刀诞生时间较长,影响较大,所以很多书籍都记载了环首刀的基本特点,以及环首刀多长。通过了解资料得知,西汉时期,正是炼钢业蓬勃发展的时期。当时,在钢铁产业的影响下,张小盒app(张小盒APP)
张小盒app(张小盒APP)来源:时尚服装网阅读:1364自己的表情包怎么制作?1、打开微信聊天界面:打开微信,选择好友进入到聊天界面。自拍表情界面选择相机:点击右下角的表情图标,切换到剪刀手自拍表情开通贵阳“客改货"国际航班 南航助黔货“包机”出境
通讯员 王继华、简丽、姬超银)随着当地物资运输及境外市场需求量逐步增加,即日起,南航贵州公司利用国际正班“客改货"开通两条往返贵阳的国际航线,目的地城市分别为泰国曼谷与日本大阪。不仅能送更多的黔此人割了大腿肉救活晋文公 为何最后还被烧死
晋文公重耳是一个比较苦逼的孩子,他本来可以在他的晋国当一个游手好闲的富贵王爷。却被兄弟逼的不得不远走他乡,流亡在外十几年。晋文公为何被逼流落在外,这其实也是一个比较狗血的故事。网络配图晋文公他爸是个老