胜彬的博客

《AI·未来》读书分享

2024-04-28T20:00:00+08:00

今天给大家分享最近读的一本书：《AI·未来》。该书作者李开复，1988年获得卡耐基梅隆大学计算机博士学位，之后曾在苹果、微软、谷歌等大厂任职，2009年成立创新工场，2023年创办零一万物。本书出版于2018年，当时是中英双语版同步上市，英文版名为《AI Superpowers: China, Silicon Valley, and the New World Order》。这个英文书名更准确地概括了本书内容，也就是对中美两个AI超级大国进行比较，并给出作者所认为的新秩序。

中国的“斯普特尼克时刻”

本书第一章从2017年5月的一个事件讲起，即柯洁和人工智能（AI）程序AlphaGo的围棋人机大战。早在2016年3月，AlphaGo以4:1战胜了韩国棋手李世石，已经引起了广泛关注。柯洁有时间研究对手，自认为有六成胜算，可结果却以0:3输给了AlphaGo，一局也没赢，直接被打哭了。

该事件被作者称为中国的“斯普特尼克时刻”。斯普特尼克（Sputnik）是苏联1957年发射的世界第一颗人造卫星的名称。当年苏联首次发射卫星引发了美国大众对苏联科技领先的焦虑，促使美国政府于次年就设立了国家航空航天局（NASA），加大了对数学及科学教育的补贴，从而推动美、苏两国进入了“太空竞赛”。大规模的全民科技动员，在12年后收获了美国首次登月的成果。

之所以把AlphaGo打败柯洁称为中国的“斯普特尼克时刻”，是想类比苏联卫星刺激了美国的航空航天发展，认为它也刺激了中国的AI产业发展。该事件后不到两个月，中国国务院公布了《新一代人工智能发展规划》。该计划明确提出2020、2025年的发展目标，并希望到2030年中国能成为人工智能领域的全球创新中心，在理论、技术及应用等方面处于世界领先地位。

但中国真得能在人工智能领域领先吗？在一些分析师眼里，中国注定要继续扮演数十年来一直保持的角色：一群被尖端领导者远远甩在身后的模仿者大军。本书作者在后面几章中，通过中美两个超级大国在AI的四个要素和四波浪潮方面的对比，来说明上述看法是错误的，中国是可以领先的。

AI普及的四个要素

一个世纪以前，新发现的电力得以广泛应用依赖以下四项重要因素：用来发电的化石燃料、电力领域的创业者、电力工程师、致力于发展基础设施的政府。今天，若想妥善利用人工智能的能力（即21世纪的电力），也需要四项要素：大量的数据、热切的创业者、人工智能科学家，以及对人工智能友善的政策环境。

中国创业公司的竞技场选拔出了世界上最精明强悍的企业家，中国的另类互联网世界创造了世界上最丰富的数据生态环境，再加上另外两方面因素——人工智能研究状况和中国政府的政策环境，硅谷的优势将不复存在。

企业家

中国企业家以模仿起家，又不局限于模仿。仿制的产品问世后，由市场导向的创业者不断迭代产品，以更优质的产品服务用户。他们不仅要击败来自硅谷的模仿对象，还得击败国内大批竞争对手生产的相似产品。书中列举了不少例子，下面是典型的两个。

第一个是马云创办淘宝。淘宝模仿eBay，但也增加了几项重要的创新：为克服中国用户对在线购物信任感的不足，创立了“支付宝”（Alipay）模式，在买方确认收到商品之前，冻结购物款项，不即时转给卖方，支付宝作为有信用的中间商来担保交易；增加了即时发送消息的功能，让买卖双方能够实时沟通； “免费+增值服务”的营收模式，即基本功能免费，增值服务收费，这也是后来战胜eBay的最大武器。当时，在eBay上发布商品要收费，商品售出时要收费，若买方使用eBay旗下的PayPal付款，卖方还得再支付一笔费用。 eBay当时还发布了一篇居高临下的新闻稿来教训马云：“免费不是商业模式”。可惜不久后，它在国内的市场占有率就如自由落体般下跌，后来完全撤出了中国市场。

第二个例子是王兴创办美团。王兴曾模仿Facebook和Twitter创办过校内网和饭否，并在此过程中积累了经验，也使他创办的美团网能够经历“千团大战”的残酷厮杀脱颖而出。此后，美团的模仿对象Groupon仅依赖自己的团购折扣主业而不思进取，到2014年股价已经跌破了发行价的一半，现在的股价更是大不如前。而王兴则不停地扩展美团的业务线，持续改造自己。伴随着中国经济的一波波风潮——高涨的电影票房、爆炸的外卖生意、庞大的观光旅游潮、兴旺的线上到线下（Online To Offline，O2O）业务，王兴对美团也在随时进行调整，并最终将其打造成一个庞大的生活平台。如今美团在共享单车、在线超市、甚至充电宝租赁等业务也逐渐占据市场主导。

在竞技场上磨炼过的中国创业者不比美国精英差。在中国，他们还拥有人工智能产业与应用所必须的第二个要素：数据。如果把人工智能比作电力，那么大数据就是发电所需要的燃料（石油）。中国借着其充满活力且独特的互联网生态系统，已经成为人工智能时代全球最大的“产油国”。

数据

想要训练出成功的AI，需要大量的算力和数据。算力可以堆叠，最终数据才能决定一切。

中国的数据优势不仅体现在数量上，在质量上也有保证。中国庞大的互联网用户群（比美国和欧洲加起来都多）提供了海量数据，这些用户在现实世界的行为又支撑了数据的质量。硅谷巨头从用户在线活动中收集数据，如搜索、上传照片、观看 YouTube视频、点赞等。中国公司则不仅如此，还能根据用户线下的行为收集数据：何时何地购买了什么物品、餐饮习惯、化妆品的选用、交通服务的选取等。这类数据与现实世界的紧密结合，在与硅谷的竞争中具备天然优势。

这得益于移动支付的普及，带动了O2O业务的渗透，模糊了线上和线下之间的界限。移动支付在中国普及的程度可以通过这样一个例子来说明：2017年3月，一对倒霉的表兄弟从外地大老远来到杭州，想“干几票大的”。两人持刀连续抢了三家便利店，却发现里面都没多少现金，因为绝大多数顾客都用手机扫码付款。两人合计只抢到了一千多元人民币，还不够来回杭州的路费……

移动支付和O2O方面中、美两个市场形成巨大的差距，部分原因是两国在上一代先进技术上的强弱差异。美国人信用卡体系成熟，中国则直接跳过了这一步。还有一个更深层的区别，即“轻量”（going light）和“重磅”（going heavy）的经营模式差异。美国公司偏向于轻量，只把一件事情做好，并局限于通过线上app或平台来打通信息；而中国公司偏向于重磅，一是体现在大而全，典型的是微信这样的超级应用，二是体现在不仅做线上，还会参与线下实体经营。淘宝物流、滴滴车队、链家自行装修和出租住房都是这方面的例子。

总之，中国的“另类互联网”通过模糊线上线下之间的界限来解决实际问题，在此同时丰富了大数据的内容生态。中美两国数据生态系统的差异在未来人工智能落地的时代将造成更为深远的影响。

科学家/工程师

不可否认，美国在科研和顶尖科学家方面确实还是领先的，但这种领先带来的优势已经没有之前那么大。如今，在被问及中国和硅谷在人工智能研究上的差距时，有人开玩笑道：差距是16小时——加利福尼亚州和北京之间的时差。由于人工智能研究的开放性和速度，大多数前沿的研究成果对全球来说几乎都是快速可见的。开放是为了给竞争一个客观标准，使结果具备可复现性；快速发表（例如立刻在www.arxiv.org这类网站公布）是因为晚的话纪录可能早就被其他研究者打破了。

另一方面，中国研究者也已经在赶超他们的美国同行，并占据越来越重要的地位。除了看论文引用数量这种量化指标，还有一个事情也体现了这一点：在2017年，美国人工智能促进协会（The Association for the Advancement of Artificial Intelligence，AAAI）举办的业界重要年度学术会议时间与中国的春节撞了车，最终举办方“花了好大力气将会议推迟了一周”。放在几年前这根本不是问题，历史上美国、英国和加拿大学者一直统治着这一领域，有论文产出的中国研究人员屈指可数。但是2017年的国际大会，提交论文的中国研究人员和美国研究人员人数已经不相上下了。

政策

在中国政府发布《新一代人工智能发展规划》几个月前，2016年10月12日，当时的美国总统奥巴马在白宫也发布了一个文件，详述了人工智能将为经济体系带来巨大转型，阐明了把握这个机遇的细节步骤，如增加研究投入、提高军民合作、投入应对社会变化等。这份总结变化、提出方案的优秀报告没有激起美国人工智能的热潮，没有为人工智能创业公司带来新一轮风投和政府资助，也没有刺激市长或者州长们发布对人工智能友好的政策。当新任总统特朗普在报告发布3周后入主白宫时，甚至直接提议减少10%的美国国家科学基金会经费。美国社会各界对白宫发布的报告反应冷淡，与2017年7月中国国务院发布人工智能发展计划后引发的全民热潮形成了鲜明对比。国内积极进取的城市纷纷采取行动，通过政府的“引导基金”将风投资金引导至人工智能领域，设置了数十个特别开发区和孵化器。例如南京当时在高新开发区成立了“智谷”(AI Valley) 。

中国政府还从政策方面大力支持和发展芯片产业，以打破过去几十年硅谷在这方面的垄断地位。科技部投入了大量资金，芯片创业公司如地平线、比特大陆、寒武纪等均获得了大量投资，用于研发针对自动驾驶和其他人工智能应用的各种产品。中国互联网巨头BAT也看到了芯片在人工智能时代的重要性，纷纷投入研发。总之，目前在人工智能芯片领域硅谷仍然处于领先地位，但这一优势可能在未来10～20年被中国赶上，因为中国在产业升级过程中采用的自上而下的推进模式，在打造新的社会秩序和经济体系时具有独特的优势。

AI应用的四波浪潮

互联网智能（Internet AI）

第一波浪潮是互联网智能，在2012年后成为主流。大体上说，互联网人工智能就是使用AI算法作为互联网内容的推荐引擎：这些算法了解、研究、学习我们的个人喜好，从而推荐专门针对我们的内容。阿里巴巴可以给用户推荐他们想买的东西，谷歌可以列出用户想点击的广告，抖音可以推荐用户想观看的视频。

作者认为，中国得益于其另类的互联网环境，目前在互联网智能浪潮中和美国算是评分秋色，但预测5年后中国很有可能（但是没有绝对把握）胜过硅谷。

互联网智能方面中美对比打分：现在（2018年）五五开，5年后六四开。

商业智能（Business AI）

第二波人工智能浪潮是商业智能，使传统公司也广泛地从人工智能发展中获利。商业人工智能给传统公司数十年来积累的大量专业数据贴标签，并通过算法利用这些数据来为业务提效。例如在金融行业，保险公司通过AI来鉴别保险欺诈，银行进行贷款风险评估和额度发放；在医疗和法律领域的，算法作为智能医生和法庭助手；等等。

在这波浪潮中，美国建立了强势的领先地位。因为美国企业习惯了使用会计、存货管理及顾客关系管理等领域的企业软件，有应用商业人工智能的原材料和意愿。中国许多传统企业的经营模式和企业文化仍然像个体经营而不是现代企业组织，它们认为不值得在第三方的专业服务上花钱，其数据也往往不够标准化，难以和现有的企业软件和优化算法结合。这方面只能慢慢转变，缩小差距。

商业智能方面中美对比打分：现在（2018年）一比九，5年后三比七。

感知智能（Perception AI）

第三波浪潮是感知智能，赋予了人工智能最宝贵的信息收集工具——眼睛与耳朵，把人工智能延伸至我们的生活环境。通过大量的传感器及智能型器材，把我们的现实世界转化成可被算法分析与优化的数据。例如智能音箱把声音环境数字化，大量摄像头和图像识别系统把城市交通流量数字化，人脸识别把面孔数字化，来保护我们的手机或数字钱包。

感知人工智能非常依赖硬件来使现实世界和数字世界同步。硅谷或许在软件创新方面仍领先全球，但硬件创新却是中国深圳在领跑。有硬件创业者说，在深圳的一星期，等同于在美国的一个月。再加上中国人对数据隐私持更开放的心态，将使中国保持对美国的优势。与此同时，这一波优势也将为第四波完全自主化的人工智能奠定基础。

感知智能方面中美对比打分：现在（2018年）六比四，5年后八比二。

自主智能（Autonomous AI）

自主人工智能是前三波人工智能浪潮的集大成者。把极复杂的数据、感知和决策能力结合起来，AI不仅能了解世界，也能改变世界，所处理的工作范围就会大大增加：代表性场景是自动驾驶汽车，还有机器摘草莓、仓储中心捡货、无人机刷墙、飓风及地震的灾后搜救，等等。

这波应用中系统的复杂性以及所涉及到的安全问题，需要核心技术和世界一流的工程师团队，这使得优势倒向了美国。美国领先地位的构成部分源自大量的顶尖专业技术人才。不过之后的情况还取决于一个待定的问题：全面应用这些新技术（例如自动驾驶）的主要瓶颈是技术本身还是政府政策？目前还不知道瓶颈将出现于何处，第四波人工智能竞赛的未来局势还不明朗。

自主智能方面中美对比打分：现在（2018年）一比九，5年后五五开。

总结中美两国在以上四波人工智能浪潮中的实力评估和发展趋势，下面是一个汇总图（图中的“现在”是2018年）。

未来

危机

有人相信现在距离实现能媲美人类甚至超越人类的强人工智能（人工通用智能，AGI）只有一步之遥，预言的中位时间是2040年。但作者认为距离真正实现的那一天还有几十年到上百年，甚至永远无法实现。

人类仍然会面临人工智能引起的危机，但这场危机并不是好莱坞大片里的机器人起义和对抗人类，而是人工智能带来的社会不平等和失业问题。我们已看到网络世界走向垄断的趋势，少数几家互联网巨头掌控了大部分的互联网。人工智能会将同样的垄断趋势带到互联网之外的行业中，使社会阶层差距日益明显。掌握人工智能技术的国家和群体可以积聚大量财富，而弱势群体则更加弱势，甚至失业。下面是书中对体力劳动和脑力劳动两大类职业被AI取代的可能性做的区分（图片为网友重绘版）。

失业影响的不只是收入，还会直接伤害到我们的认同感和价值感。如果是人工智能导致的失业，带来的心理创伤还会更大。人们只能看着自己用一生时间学习并掌握的技能，被算法或机器人轻而易举地超越。既然我们能做的机器都能做，那我们作为人类的意义是什么?

蓝图

针对人工智能将引发的失业问题可以从以下三个方面去解决（3R方案）：一是就业者再培训（Retraining workers)，推行在线教育和终身学习，不断掌握新技能；二是减少工作时间（Reducing work hours），每周工作日变为四天，多人“分享”同一份工作；三是重新分配收入（Redistributing income），通过税收和低保等调节手段，保障全民生活和社会稳定。

在这些具体措施之外，作者还提出了他理想中未来蓝图的大方向：人与AI和谐共存，各自做自己所擅长的事情。人类更多地投入到使社会更有人情味和创造力的工作中：护理（Care），服务（Service），教育（Education）。这里面大概包括抚养孩子、陪伴老人、帮助患病或有缺陷的人提升生活品质，治理环境、导游导购，学习知识、艺术，培养兴趣爱好等等。这样的蓝图不能只靠自由市场和利润最大化的经营逻辑，需要通过政府的社会贡献津贴、投资人的影响力投资、企业的公益活动和社会责任行为等方面的努力来逐步实现。

结束语

虽然全书前面大量篇幅讨论中美的对比，但结尾部分强调了AI的发展不是军备竞赛，而是我们共同的未来。作者最后说到：“我相信，人工智能的到来，是为了帮助人类从乏味、无趣的例行性工作中获得解放，并且推动我们思考人何以为人，以及人生在世的意义。”

新年伊始

2024-01-02T20:00:00+08:00

日子匆匆地过去，2024年的第一天也不例外。

这天是元旦放假，我起的比平时更晚一些。家里人又把午饭早早做好，于是上午还没怎么过就过去了。吃完午饭十二点多，我带着正正（我家大娃）出去玩。

翠翠（也就是娃他妈）在家带另一个娃。我们才生了二胎不久，如今老二才半岁左右，两个孩子一般都是这样分开来带。翠翠不止一次说，等冬去春来，我们就可以一起带俩孩子出去玩了。不过这要等到半年后了。

正正还不饿，所以没吃午饭。临出门时，翠翠说，你们玩一个多小时就回来吧，再做饭给正正吃。我说，看情况吧，或者就在外面吃。

我们出去时带了跳绳。翠翠给正正报了跳绳的培训班，最近一直在督促孩子练习。他们母子约定好，如果正正一分钟跳绳超过了一百次，就可以去游戏厅玩。我带正正来到小区外的广场，热身后，就开始给他计时跳绳。他努力跳，果然一分钟跳了一百次！于是我们把视频发给翠翠看过，就去游戏厅了。

我们在附近商场的游戏厅玩了大概半个小时。去之前翠翠嘱咐说，不要在室内多待，否则对眼睛不好，玩一会儿就早点出去吧。可是在出去的路上，我们遇到了商场举办的新年活动。这个活动需要在商场内四处寻找任务并完成，通关后奖励一张彩票。正正很感兴趣，我就和他一起参加了。我们大概花了一个小时完成，最后的彩票还幸运地中奖了20元。

从商场出来，已经下午三点多了。正正肚子饿了，也不想回家吃饭，我们就决定在外面吃。我要带他去武圣羊汤，我们前几天去过一次，正正还挺喜欢。翠翠说正正还在咳嗽，不适合去这个，不如去旁边的庆丰包子铺。但我们终究没听，还是去喝了羊汤。

回家的时候已经快到碗饭时间。吃完晚饭，换成我带老二，翠翠辅导正正学习。学习时间从七点半持续到八点半，这期间我抱着老二听广播。老大学完习，刷牙洗脚睡觉。我们把老二也哄睡后，就晚上十点多了，然后各自玩会儿，一天就结束了。

大部分时候生活就是这样的流水账。

职场感言

2023-12-31T20:00:00+08:00

2023年马上结束了，才发现今年没怎么新增文章。按惯例这时候要写个年度总结，可也没什么想说的。这一篇就把过去随手写的一些职场感言汇集在这里吧，算是凑个数。

名不正则言不顺，言不顺则事不成。虽然原话中“名”指的是名义，但换成名称也适用。名称没定好，可能是事情没想清楚，无论是写代码时的变量或函数，还是组织架构中的部门或团队。

写双月OKR时罗列一堆想做的事，结果也都未完成，下个双月只能继续罗列，这是否会给人一种“圈地”或“占坑”的感觉？写进OKR的是要重点做，不写进OKR并不意味着不做。

一个游戏，如果只能靠堆时间刷经验才能通关，无法通过好的技能、装备配置去获得优势，那这个游戏估计好玩不到哪里去。一个公司或组织，如果只能靠上班时长和工作年限才能上位，那这个公司估计也没啥吸引力。

记得谁说过，成功晋升的三个条件：首先你要行，其次要有人说你行，再者说你行的人要行。

初级者立功，实现功能；中级者立言，撰写文档；高级者立德，积攒人气。

努力使自己更容易替代——代码清晰，文档清楚，写好README，便于他人接手，最终反而不被替代。

删除代码对能力要求更高。初级工程师只敢添加，中级工程师则开始修改，高级工程师要敢于删除。

基调、节奏、靠谱、和谐，“写一首皆大欢喜的歌是越来越难”。

坚持更新博客也是越来越难啊。

ChatGPT相关调研

2023-03-17T20:00:00+08:00

本文是对ChatGPT的调研，包括ChatGPT是啥，它是怎么来的，之后会怎样。

ChatGPT是啥？

聊天机器人

普通用户初见的ChatGPT是一个聊天机器人，或者智能助理。它能回答各种问题，并基于此帮人做各种事情。下面是个例子。

和Siri不同，它无法解决“今天天气怎样？”甚至“现在几点？”这样的问题。因为它缺乏2022年及之后的信息，并且不具备实时查询或搜索的能力。

应用编程接口（API）

用于实现上述聊天功能的是OpenAI提供的编程接口。

调用示例：

# Note: you need to be using OpenAI Python v0.27.0 for the code below to work
import openai

openai.ChatCompletion.create(
  model="gpt-3.5-turbo",
  messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Who won the world series in 2020?"},
        {"role": "assistant", "content": "The Los Angeles Dodgers won the World Series in 2020."},
        {"role": "user", "content": "Where was it played?"}
    ]
)

返回结果：

{
 'id': 'chatcmpl-6p9XYPYSTTRi0xEviKjjilqrWU2Ve',
 'object': 'chat.completion',
 'created': 1677649420,
 'model': 'gpt-3.5-turbo',
 'usage': {'prompt_tokens': 56, 'completion_tokens': 31, 'total_tokens': 87},
 'choices': [
   {
    'message': {
      'role': 'assistant',
      'content': 'The 2020 World Series was played in Arlington, Texas at the Globe Life Field, which was the new home stadium for the Texas Rangers.'},
    'finish_reason': 'stop',
    'index': 0
   }
  ]
}

message中的任意字符（role、content等）都占用token数。一个token对应一个英文单词，或者（如果单词较长）一个单词中的一部分。输入加输出的token数量上限为4096，对应英文词数为3000左右；超出的会被截断。调用时需要包含历史消息才能取得好的效果，尤其当上下文是必要的时候。例如上述消息“Where was it played?”中it的理解就依赖上下文。

另有输入参数temperature，用于控制结果的随机性，设为0则每次返回一样，大于0的值可以避免千篇一律。

大规模语言模型

所谓语言模型，就是对真实自然语言的数学建模。该模型接收给定的输入文本序列，预测接下来会出现什么字符（给出出现各个字符的概率分布）或字符串。

例如输入：

As Descartes said, I think, therefore,

模型输出：

I am.

从而补全了“如笛卡尔所说，我思，故我在。”这一英文句子。

这是语言模型的典型应用方式：输入引导词/提示（prompt），由模型接着做补全（completion）。如果引导词设计合理，且补全做的很智能，则可以用于解决自然语言处理（NLP）的各项任务。这里既包含文本理解，也包含文本生成。如何适配特定任务就变成了如何进行“引导词设计”。 “不是AI回答的不好，是我提问的方式不对”就源于此意。

下面是一些NLP任务引导词的例子。

分类：

Decide whether a Tweet's sentiment is positive, neutral, or negative.
Tweet: I loved the new Batman movie!
Sentiment:

翻译：

Translate this into French, Spanish and Japanese:
What rooms do you have available?

问答：

The following is a conversation with an AI assistant. The assistant is helpful, creative, clever, and very friendly.
Human: Hello, who are you?
AI: I am an AI created by OpenAI. How can I help you today?
Human:

对这些引导词内容的成功续写，就是我们想要的任务结果。

ChatGPT本质上就是一个超大规模的语言模型。它对外展示的聊天（chat）功能也是基于强大的“引导词+补全”机制来实现。

大规模语言模型（Large Language Model，LLM）中的“大”体现在训练采用的语料多、模型参数多等方面。ChatGPT属于GPT系列模型中的第3.5代。该系列从第一代GPT-1开始，规模就在几十成百成倍地增长。如下表所示：

	发布时间	模型参数量	预训练数据大小
GPT-1：	2018年6月	1.17 亿	5 GB
GPT-2：	2019年2月	15 亿	40 GB
GPT-3：	2020年5月	1750 亿	45 TB

ChatGPT怎么来的？

GPT：预训练+微调，半监督学习

GPT全称为Generative Pre-Training，源于论文《Improving Language Understanding by Generative Pre-Training》。其提出将NLP任务的解决方法从监督学习（需要大量标注数据）演进为半监督学习：先从大量无标注语料得到任务无关的预训练模型，然后用任务相关的标注数据做微调（fine-tune）。

论文中的下面两幅图展示了方法的架构和效果。

可以看到，GPT采用了transformer架构。该架构中encoder来理解输入，decoder来生成输出，并且通过attention机制能覆盖到更长/更远的上下文信息。

GPT-2和GPT-3：任务无关模型，无监督学习

GPT-2和GPT-3除了模型规模的增大，在预训练之后不再针对特定任务进行微调，而是直接用无监督训练出来的语言模型，通过“引导词+补全”的方式来完成各项任务。

在GPT-3的论文《Language Models are Few-Shot Learners》中，引导词所包含的提示信息又分为了以下三种程度：

Few-Shot，即在引导词中给出K（10～100，受限于2048的token数量）个例子，模型接着进行补全。
One-Shot，在引导词中给出1个例子。
Zero-Shot，不给例子，仅描述任务。

对于Few-Shot的情况，它相当于是把给出的几个例子作为标注数据进行了简单的fine-tune。在OpenAI提供的API中，也支持自行上传更多标注数据进行fine-tune以更好解决特定任务。

GPT-3能够理解任务描述并较好完成，部分表现已经超过监督学习的模型。这得益于它使用的海量预训练语料，包括：

Common Crawl，从2008年开始十几年的网页抓取。
WebText，OpenAI研究者选取的高质量网页（在reddit上经过用户点赞3次的链接）。
Books1和Books2，两个互联网书籍语料库。
English-language Wikipedia。

InstructGPT：重新加入监督学习，反映人工偏好

GPT-3的优化目标是补全的文字更符合统计概率，但结果不一定是人想要的。其改进版InstructGPT则通过加入监督学习和人工反馈，使语言模型的输出更符合人的意图。这称为对齐（alignment）。

例如下面的对比中，GPT-3的回答明显像是从一些出题或问答类网站上学到了频繁出现的套话，而不像InstructGPT那样是我们想要的回复。

InstructGPT的具体训练方法如下图所示（来自论文《Training language models to follow instructions with human feedback》）。

主要包括三个部分：

人工标注补全输出，形成示例数据集，用来对GPT-3进行有监督的微调（Supervised FineTune，SFT）；
人工标注对不同补全输出的偏好排名，形成对比数据集，用来训练奖励模型（Reword Model，RM）；
使用第2步训练得到的RM作为奖励函数，通过强化学习优化第1步训练得到的SFT模型。

ChatGPT：增加安全性

ChatGPT和InstructGPT采用了同样的方法，只是数据采集方式稍有不同。此外，ChatGPT在发布后的持续迭代中，加入了内容过滤等安全机制，减少了有害内容。

或许，教模型不该说什么，和教它该说什么一样充满挑战性。

之后呢？

扩展能力

ChatGPT发布以后，它相关的扩展能力也逐渐成熟可用（虽然有些还处于beta版）：

文本的插入和修改：这倒是可以通过补全一个正确的最终结果，然后和输入做对比来实现。
写代码：Codex，加入了GitHub上的代码作为训练数据（编程语言和自然语言可以类似处理）；它是GitHub Copilot的基础。
音频转文本：Whisper，利用音频和其对应文本作为标注数据，通过监督学习得到的额外模型。
图片生成：DALL-E，将图片处理成像文本一样的1024个token，和图片标题对应的256个token一起作为训练数据。

GPT-4

近日，ChatGPT的下一代GPT-4发布，包括了以下几个新特性。

一、将token上限提升至8192甚至32768（约支持2万多单词），可以处理更复杂的任务了。

二、新增了图片的读取和理解，能解下面这样截图给它的题目。

三、加强了可操纵性，可以指定模型表现为特定“人格”。例如前面API部分有 {“role”: “system”, “content”: “You are a helpful assistant.”}这样的系统信息，用于指定该模型为回答问题的助手。在GPT-4中，该功能得到强化。例如我们可以将系统信息换为”You are a tutor that always responds in the Socratic style. You never give the student the answer, but always try to ask just the right question to help them learn to think for themselves.”，来指定模型的回复风格为“苏格拉底式”，也就是不直接回答问题，而只通过反问来引导提问者自己思考解决问题。

看来，AI不仅可以表现得像人，还能像不同的人。

我入职字节三年时

2023-02-13T20:00:00+08:00

今天，我入职字节跳动已经六周年了。

但这篇要发的文章呢，却是我在2020年初，加入字节3年多一点的时候写的。当时字节跳动成立8周年，创始人张一鸣发了封题为《字节跳动8周年：往事可以回首，当下更需专注，未来值得期待》的全员信。我仿照这封信，写下了自己的《入职字节3周年》。

下面正文和引用里分别贴的就是我和一鸣各自写的内容，对照阅读最佳。

今天是我加入公司3周年多一点儿的日子。在这个远程办公的新模式下，我在线上跟大家聊聊新想法。

今天是公司创立8周年的日子。在这个远程办公的新模式下，我在线上跟大家聊聊新想法。

我想在这个时间节点做一个比较大的工作调整：最近，我准备加入字节博士后工作站，联合北京大学进行基于大数据的视频播放体验优化项目。作为字节跳动首批博士后，接下来我会花更多时间精力在学术和前沿研究，侧重论文和专利等知识产权积累，也帮助接替我之前的技术落地和业务支持工作的同事更好地融入。

我想在这个时间节点做一个比较大的组织升级：今天，公司会任命张利东和张楠(Kelly)分别为字节跳动中国董事长和CEO，整体负责字节跳动中国业务的发展。作为字节跳动全球CEO，接下来我会花更多时间精力在欧美和其它市场，和Alex一起把字节跳动全球管理团队完善，也帮助新加入的ErichAndersen、Roland Cloutier等更多同事更好的融入。

过去3年，字节跳动飞速发展，我所在团队已经从一个小组，扩展为给更多业务提供视频和图片相关技术的大平台，团队人数今年也达到了近千人。在成长道路上，我遇到很多的挑战。

过去8年，字节跳动飞速发展，我们已经从一个小产品，成长为给全球用户提供多个产品服务的大平台，全球员工人数今年也将达到10万人。在成长道路上，我们遇到很多的挑战。

为了应对业务的变化，我一直在个人能力和所负责事情上不断提升和适应。比如，从专注算法到参与平台建设；从写模块代码到进行架构设计；项目管理和沟通协调类工作也不断增多。但如何达成视频端到端系统更大范畴的优化目标，对我来说，还是新的课题。

为了应对业务的变化，我们一直在公司组织和合作方式上不断优化调整。比如，明确主要业务的CEO和管理团队；建立各业务虚拟的P&L，帮助各业务更好的做决策；绩效管理和OKR工具也不断更新。但如何建立好一个超大型全球化组织，对我们来说，还是新的课题。

随着业务接触变多，工作内容不断复杂，上级也对我提出了更多要求。过去一段时间，我经历了不少流程。除了绩效评估和调级调薪，还有部门组织架构调整，有人员的转岗和变动。我对个人成长和团队发展的关系有了更深刻的理解。我们年轻人有能力有理想，要认真思考和同事的关系，对团队的贡献。

随着业务的变大，外部效应也不断扩大，社会也对我们有了更多期待。过去一年，我花了近2/3时间去了全球很多地方。除了了解公司业务，我还跟很多当地的同事和朋友交流，去德里迪利哈特市集做用户调研，去巴黎朋友家做客，去各地博物馆了解历史，我对世界的丰富性和文明的演化有了更深刻的理解。我们在全球多个国家有业务有用户，要更认真思考和外部世界的关系，对外部世界的贡献。

不止于此，在我比较熟悉的多媒体处理平台业务之外，我也开始推进更偏下游播放端的策略。对我来说，这是一种扩展，但我对播放策略前沿算法的积累还不是很够。

不止于此，在我们比较熟悉的信息和内容平台业务之外，我们也开始探索很多全新业务的方向。对我们来说，这是一种跨界，但我们对于这些新业务的认知还远远不够。

这些挑战要求我的能力塑造有更多方面。除了项目推动和团队建设，我会从之前已有日常工作中腾出精力来，重点关注几个事情：

这些挑战要求我们公司的组织方式有更多变化，除了完善全球管理团队工作，我会从公司日常运营中腾出精力来，重点关注几个事情：

1、研究如何更好优化视频播放体验

1、研究如何更好地改进超大型全球化组织的管理

坦白讲，在复杂多变的网络状况和各种各样的业务场景下优化视频播放，并不容易。这还不包括，不同用户对体验的偏好或许也有差异。过去一段时间，我们已经感受到不少遇到瓶颈的问题，最直接的体现是业界和学术界对传统视频自适应码率的兴趣下降了。

坦白讲，管理一个在30个国家，180多个城市，有超过6万名员工的公司，并不容易。这还不包括，我们教育业务在北美的5000位外教，公司行政体系的外包员工等等。过去一年，我们已经看到了不少管理问题，最直接的反馈是员工敬业度和满意度统计结果下降了。

我争取在未来两年调研清楚最近的相关工作论文，了解业界也学习学术界前沿进展。我们的目标不仅是提出新的算法，更是提出新的架构和优化体系。通过更好的系统，丰富每个视频播放策略的优化手段和可用信息，提升用户体验。

我争取在未来三年走遍所有有办公室的地区，了解公司也学习当地文化。我们的目标不仅是建立全球化的业务，更是建立全球化的多元兼容的组织。通过更好的组织，激发每个人的潜能和创造力，服务全球用户。

我们一直说improve Quality of Experience (QoE)，理解体验质量和服务质量的关系模型是什么，对提升体验很重要。

我们一直说develop a company as a product，理解公司这个产品的本质是什么，对改进管理很重要。

2016年之前我看很多东西，也有很多思考，并在自己的工作中进行实践。在公司已经落地应用的HEVC/H.265编码格式，来源于我理解最新视频编码标准反复强烈的强调——压缩降低视频带宽成本。“通过增加计算复杂度，换取压缩效率”，这是视频编码标准的一贯套路。HEVC/H.265标准的定稿，启发了我对其成本节省空间的重视和在字节的实践。DASH标准的发布，促使我思考视频系统演进方向是什么，以及如何从传输格式方面升级公司流媒体技术体系。我坚持的“先跑通，再做优化”的理念，受到开源项目的直接影响。当然也很大程度上跟我们一开始没有人力做到最优的实际情况有关，我认识到快速尝试、逐步迭代的重要性。

2016年之前我看很多东西，也有很多思考，并且在我们公司管理中进行实践。字节范中的坦诚清晰，来源于我试图理解杰克韦尔奇在《赢》中反复强烈的强调——坦诚降低组织交易成本。“知识型组织中，每一个人都是管理者”，这是德鲁克关于管理者的重新定义。他对于目标管理的思考，启发了我们对于组织有效性的重视和OKR的实践。他和科斯的想法，促使我思考企业边界是什么，以及如何从外部视角衡量组织内部的交易成本。我们坚持的“context, not control” 的理念，受到Netflix的直接影响。当然也很大程度上跟哈耶克关于理性的自负的论述有关，我认识到信息透明、分布式决策和创新的重要性。

公司和团队变大，会带来很多新的变化。在技术布局、事情优先级、分工协作上都有体现。事情上，如何看待使用开源和进行自研，在二者之间应该如何取舍权衡；分工上，在算法、组件和系统三个层面交叉下应该如何配合。当然相应的，公司高阶人才也需要去扩展新的领域。对我们来说，过去两年，其实是落地多创新少。我之后会花更多时间探索研究，也和高校的老师一起联合创新。

科技公司组织方式变化，会带来很多新的变化，在业务、财务、人力方面都有体现。财务上，如何把UG中的LTV引入内部财务报表，各个业务之间应该如何结算成本。人力上，在职能、业务、市场三个维度交叉下应该如何组织人才。当然相应的，企业内部工具也需要新的研发优化。对我们来说，过去两年，其实是问题多思考少。我之后会花更多时间学习研究，也和ES的同事一起讨论提升。

2、研究数据如何创造更大的价值

2、研究科技公司如何创造更多的社会价值

去年下半年开始，我和团队成员重新认真讨论后续的规划是什么。我们是从更广的范畴开始讨论的。什么是数据，什么是数据驱动？为什么数据驱动会带来更多优化收益？数据是“a collection of discrete values that convey information, describing quantity, quality, fact, statistics, other basic units of meaning, or simply sequences of symbols that may be further interpreted”，能实现数据驱动的基础条件是不断积累和理解“values that convey information”。数据驱动如果能不断优化视频播放策略，其价值就会越来越大，影响力也会越来越广。

去年下半年开始，我和管理团队重新认真讨论公司的本质是什么。我们是从最基础的问题开始讨论的。什么是科技，什么是科技公司？为什么科技公司需要承担更多社会责任？科技是指the application of scientific knowledge for practical purposes, especially in industry，能成为科技公司的基础条件是不断的学习 scientific knowledge。科技公司如果能不断提升认知改进方法，其杠杆就会越来越大，头部公司在经济中的占比越来越高，对人们生活的影响会越来越大，也越来越受到监管关注。

从外部来讲，用户对视频产品的体验要求越来越高。从内部来讲，团队成员也需要更多事情去创造绩效。为用户提供最好的视频播放体验，这是我们做视频技术中台的的责任。但是我们还要思考如何在已有现状下进一步突破，积极结合算法和大数据，创造新的价值。

从外部来讲，公众期待会越来越高，从内部来说，员工也需要更强的使命感来承担更大的责任。为用户提供创新、高品质、有效率的产品和服务，这是企业基础的社会责任。但是科技公司还要思考如何面对自己的外部效应，积极和外部各方合作，创造社会价值。

过去一年，我们在多媒体大数据方向做了很多工作，包括建立数据通路，要求每个业务线上报端到端数据。数据收集、展示、分析等几个环节很成功，但总体我感觉还不够，尤其是和我们要驱动策略算法迭代优化的目标相比。

过去两年，我们在企业社会责任方向做了很多工作，包括建立公益部门，要求每一个业务都有CSR的目标和规划，和用户目标、商业目标并列。寻人、助医、扶贫等几个项目很成功，但总体我感觉还远不够，尤其是和我们要在全球范围达到较高的水平的目标相比。

我会和更多的同事以及外部交流，一方面更好地了解学术前沿的进展，一方面探索如何在公司内建立更好的机制去体现更多数据价值。

我会和更多的同事以及外部交流，一方面更好地了解世界当下的问题，一方面探讨如何在公司内建立更好的机制去承担更多社会责任。

3、思考和规划个性化播放等新算法方向

3、思考和规划教育等新战略方向

短视频播放是抖音产品成功的基础。大家应该了解，我司一直很重视推荐技术，对个性化的潜力充满期待。我认同这个方向，对视频产品来说，推荐的意义，是通过这个方式来满足不同用户对内容的偏好。我会再加上另外一点——除了推荐观看哪些视频，还应该推荐如何播放。对的，优化播放体验可以采用和优化内容一样的思路：personalized recommendation。

教育是公司跨界尝试的新业务方向。大家应该了解，我一直很重视人才招聘，对个人的潜力充满期待。我认同德鲁克的说法，对于公司内部来说，公司存在的意义，是通过公司这个方式实现人们的创造力。我会再加上另外一句——让每个人有更丰富有意义的经历和体验。对的，和我们用户产品的使命一样：inspire creativity, enrich life.

2019年有一段时间，我发现和高校合作中不少成果都来自对大数据的分析。我特地去北大拜访了几位老师。从基于数据的分析成果，以及对公司所擅长的推荐技术的调研，让我直接认识到个性化对持续提升用户体验非常关键，而且体验模型本身也有改进空间。这算是我准备开始研究工作的一个起点吧。过去两年中，我跟进过不少高校合作，包括在不同论文中作为不同排名的作者，但因为时间精力有限，不够持续。接下来，我会更侧重创新的研究。

2016年有一段时间，我发现公司好多优秀的算法人才都来自上海交大ACM班，我特地去上海拜访了俞勇老师。从交大ACM班的成材率，以及后来对Minerva University的调研，让我直接认知到教育对激发人的潜力非常关键，并且教育本身也还有巨大的潜力。这算是我认真思考教育业务的一个起点吧。过去两年中，我访谈过不少老师学生，包括到不同课堂体验不同的教学效果，但因为时间精力有限，不够持续。接下来，我会重启对教育的访谈观察。

最近字节发展非常快，很多人考虑自己后续的职业发展。我其实不焦虑，有耐心，我觉得现在视频播放体验还没做到极致，优化算法必须有更根本的创新，当然前提是我们有更多的探索投入。尤其对技术领域差不多定型的员工来说，启动新方向是不容易的，有惯性也有惰性。在新的领域大胆的尝试，是始终创业的重要标志。

最近在线辅导市场非常热，很多人问我公司的业务进展。我其实不焦虑，有耐心，我觉得现在还是很早期，教育业务必须有更根本的创新，当然前提是我们有更深刻的认知。尤其对于已有成功业务的公司来说，启动新业务是不容易的，有惯性也有惰性。在新的领域大胆的尝试，是始终创业的重要标志。

三周年之际愿大家：往事可以回首，当下更需专注，未来值得期待。

八周年之际愿大家：往事可以回首，当下更需专注，未来值得期待。

从2020年到现在，几年已经又过去了，我博士后已经出站，并且继续在字节供职。在这个入职周年的日子，不妨再说一次：“往事可以回首，当下更需专注，未来值得期待”。

《皇帝的新脑》中文翻译确实不咋样

2022-10-25T20:00:00+08:00

《皇帝的新脑》是我刚看完的一本书。它是由英文翻译过来的中译本。书的内容还行，不过网上对这本书的中文翻译评价较差。我读的过程中确实也感觉到，译文风格过于接近英文，遣词造句比较生硬，令人觉得不“雅”（“信达雅”的“雅”）。

大部分情况下，准确性倒没啥问题。不过下面给出的这个例子，已经影响到对作者意思的理解了。我在读这部分中文的时候没读懂，还特意去找了原文来看才明白。

这是作者分成序和跋两部分（分开写在书的前面和后面）讲的一个小故事。故事讲述在“超子电脑”发布会上，总设计师让现场观众问该电脑一个问题，从而启动它。

序的最后写到：

……

“可是必须得有一个人来提问呀?”总设计师请求大家。可是大家都害怕，似乎感到了一个新的全权的威慑。亚当可没有这种恐惧。他和电脑一起成长的，他几乎知道作为一台电脑它可能会怎样感觉。至少他自认为他可能知道，不管怎样，他总是好奇。亚当举起手来。

“呕，好的，”总设计师说道，“第三排的这位小青年，你要向我们的新朋友提个问题，是吗?”

到这里就没往下讲，而是先开始正文了。等正文结束后，跋的部分接着写了如下内容：

“感觉像是？嗯⋯⋯一个最有趣的问题，我的年轻人。嗯，⋯⋯我自己也想知道答案，”这位总设计师说道， “让我们来看看我们的朋友对这问题怎么说⋯⋯真奇怪⋯⋯呃⋯⋯超子电脑说它不知道⋯⋯它甚至不能理解你想问的是什么!” 会堂里的笑浪声终于爆发成大笑。

亚当感到非常难为情。不管他们做出什么，他们都不应当笑啊。

作者特意在中间略去了小男孩亚当的问题。不过从翻译的文本来看，很难知道他问了啥。我读了原文后，才清楚多了。对应的英文原文如下。

……

“Surely there must be someone?” he pleaded. But all were afraid, seeming to sense a new and all-powerful consciousness. Adam did not feel the same awe. He had grown up with computers since birth. He almost knew what it might feel like to be a computer. At least he thought perhaps he did. Anyway, he was curious. Adam raised his hand.

“Ah yes,” said the Chief Designer, “the little lad in the third row. You have a question for our ah- new friend? “

（特意留白）

“FEEL LIKE? Oh, a most interesting question, my lad. Er, rather like to know the answer to that myself”, said the Chief Designer. “Let’s see what our friend has to say about… that’s odder … Ultronic says it doesn’t see what… it can’t even understand what you’re getting at!” The ripples of laughter about the room burst into a roar.

Adam felt acutely embarrassed. Whatever they should have done, they should not have laughed.

我个人觉得翻译不妥的地方主要在于下面这部分：

“He had grown up with computers since birth. He almost knew what it might feel like to be a computer. At least he thought perhaps he did. Anyway, he was curious. Adam raised his hand.”

这几句之间其实是有连贯性表意的。我来翻译的话会是：

“他自打出生起就伴随着电脑一块儿长大，因此他几乎知道作为一台电脑会是什么感觉了。至少他自己觉得知道了。不管怎样，他想弄清楚。于是他举起了手。”

然后再结合设计师的回应（“FEEL LIKE? Oh, a most interesting question, my lad. Er, rather like to know the answer to that myself” / “什么感觉？嗯，相当有意思的问题啊，小伙子。我本人也想知道答案呢”），就能比较容易猜出小男孩问的问题是：“作为一台电脑是什么感觉呢（What doest it feel like to be a computer）？”

此外，还存在其他一些小问题，例如“most interesting”中的“most”不应理解为“最”，对“lad”的翻译前后不一致，等等。这都体现出原翻译的不给力。

本书作者在序的部分写完后，正文第一章的标题是“CAN A COMPUTER HAVE A MIND? ”。其实如果暗指这就是小男孩的问题，从形式上看倒是挺巧妙。不过这和跋部分开头的“FEEL LIKE？“对应不上，所以也只能排除这一解释。作者当时究竟真实意图如何，我也不得而知了。

最后提一句，我在读的另一本书《哥德尔、艾舍尔、巴赫——集异璧之大成》，看上去翻译得就很好。毕竟其译者和作者还专门就翻译相关问题进行过深入的沟通交流。

四大班子

2022-10-16T20:00:00+08:00

趁党的二十大开幕之际，我来总结下“四大班子”的相关信息。

“四大班子”一般是指党委、人大、政府、政协这四个重要机构的领导。下面分别介绍这四个机构。

党委

党委是中国共产党从中央到地方的各级委员会。下面主要说中央，地方的类似。

党的中央委员会由每5年一届的党的全国代表大会选举产生。前面提到的二十大就是指党的第二十次全国代表大会。在党的全国代表大会上，来自全国各地的党代表共两千多人，选举出二百多位中央委员会委员。在这一届的5年间，中央委员会每年召开一次全体会议，共开5次。例如十八届三中全会，就是其中的第三次。每一届的一中全会一般紧接着10月份的全国代表大会召开，选举出中央政治局委员（二十几人）、中央政治局常务委员（几人），然后从中央政治局常务委员中选出中央委员会总书记，并确定书记处、中央军委、中央纪检委等其他重要结构成员。在中央委员会闭会期间，中央政治局和它的常委就以书记处为办事机构，来具体领导工作和行使职权了。

人大

人大是人民代表大会的简称，全国和地方都同样举办。相比于党的全国代表大会是仅限于党员的党内会议，人大是全部人民的会议。每年的“两会”就是指基本同期召开的人大会议和下面要说的政协会议。全国人大每届任期5年，每年举办一次全员会议（一般是每年的3月份），共有代表3千人左右。在第一次全员会议上，选举出本届的人大常务委员会，作为其常设机关行使职权；另外也会选举出国家主席、最高检、最高法院长等国家级领导。之后的几次全员会议上会进行政府工作报告等每年例行事宜。

人大常务委员作为常设机关，共二百人左右，每年要开几次会议，进行立法等具体工作，也负责每次人大全体会议的召集。

政府

政府是由人大选出、具体办事的行政机关，从国务院到地方政府，分为部、局、处、科等各级单位。这个体系相对更为人所熟悉一些，就不再赘述了。

政协

政协全称是中国人民政治协商会议，是中国共产党领导下的统一战线组织。顾名思义，其目的主要是促进多党合作和政治协商。政协的委员会组织形式和时间基本上和人大是一样的。每届全国政协委员两千多人，常务委员三百人左右。除了包含党派外，政协还设置有妇联、共青团、科学技术协会、体育界、宗教界、台湾同胞联谊会等几十个“界别”。

各级政协中，党外代表人士占有较大比例（不少于60%），这也使政协成为四大班子中唯一不以中国共产党党员为主的机构。

黑暗之魂

2022-09-19T20:00:00+08:00

《黑暗之魂》（Dark Souls）是魂类游戏的典型作品。我虽然没有把三部曲全部通关，但对其世界观还挺感兴趣的。不过作为这类游戏的传统，相关剧情和世界观都没有系统性和较明确的展现，需要玩家自行搜集和汇总资料。下面是我整理的一些信息。

相比于《血源诅咒》，我对《黑暗之魂》并没有投入那么多精力（同时也是因为后者的体系更庞大些），所以整理的结果也相对更加粗糙和零散些。

故事背景

最初，世界由巨蛇占据。后来初火显现，并随之出现了四个王魂（Lord Souls）。游戏标题黑暗之魂就是其中之一。

这四个王魂被四人分别拥有，他们共同战胜了巨蛇，然后建立了四个王国，称为初始四王。这便是火之时代（The Age of Fire）的开始。

然而随着时间推移，初火慢慢将要熄灭。初始四王之一的格温，不愿看到火灭，一直尝试传火。

代代相传的延续初火过程中，出现了黑暗印记（Darksign）诅咒。有此诅咒的人，每当死去就会复活（在篝火处重生），并逐渐失去人性，变成活尸（Hollow）。他们被称为不死人。

游戏的主角就是这样一个不死人。他被引领去继承格温的传火大业。不过玩家也可以在结局选择灭火，彻底终结传火大业。

传火让人失去人性，或许黑暗才是人的本性……

主要人物

Gwyn（格温）：致力于传火。害怕黑暗来临，亦即黑暗之魂（Dark Soul）的后代占领世界。

Frampt：一个初始巨蛇，和格温同谋，希望传火。

Kaathe：一个初始巨蛇，希望阻止Gwyn，回归黑暗时代，认为这才是自然的本质。

被选中的不死人（The Chosen Undead）：魂游戏主角，唤醒Frampt，战胜包括格温在内的初始众神，收集三个王魂，成为新的薪王来传火。

Manus：初始人类；被Kaathe操纵人类唤醒，其人性扰动产生了黑暗的深渊。被打败后灵魂散开，变成了深渊的女儿（Daughters of The Abyss）。人性和黑暗并不是本恶，因被扰动和扭曲才产生了深渊。

Vendrick：想依靠火的力量治好诅咒，建立了Kingdom of Dranglaic，但最终还是没能成功，自己活尸化了。

Nashandra：Vendrick的妻子，其隐藏身份是深渊的女儿（即Manus的灵魂碎片）；在王进行传火前窃取其力量，目标是延续黑暗。

Aldia：想通过研究人的本质治好诅咒，最终也没成功，认为活尸才是人本来的状态，人性是短暂的幻象。他称为原罪学者，和Vendrick同属于Kingdom of Dranglaic。他所定义的第一原罪（The First Sin），就是把活尸的本质隐藏，创造人可以死、并非活尸的谎言，让人害怕活尸化。

治疗诅咒的不同途径

Vendrick的途径：靠获取火之力量，避免人性的损失；但失去力量就失效了。

Aldia的途径：通过研究，希望能在活尸状态保持理智；认为这才应该是常态。

关于火的概念

余火（Ember）：剩余的火之力量；可以激发余烬重新燃烧变强。

余烬（Ash）：已经燃尽的灰；传火并且被耗尽的弱者；可以被余火激发。

余薪（Cinder）：没有燃尽的碳或柴；传火并且活下来的强者。

几位薪王（The Lords of Cinder）

Ludleth the Exiled：很早之前自愿传火。

Aldrich Saint of the Deep：从噬人到噬神，变强大后被用来传火（并非自愿）。其坚信黑暗时代，想把神都消灭，这样就没有神来维持火的时代了，吞噬了Gwyndolin。

Farron’s Undead Legion of Abyss Watchers：多位一体，共享狼血，防止怪物从深渊出来，发誓传火以对抗深渊。

Yhorm the Giant：希望通过传初火来结束罪业之火。但罪业之火还是烧毁了罪业之都，烧死了除它之外所有人。

Lothric：拒绝传火。

博士后

2022-08-17T21:00:00+08:00

我2016年博士毕业。之后的几年，关于学术我就没什么投入和产出了。

不过从2020年夏开始，我重新入学，进行为期两年的博士后工作，陆续又开始发表学术文章。

今天，博士后工作结束，出站手续完全搞定后，拿到了如下这张博士后证书。

可以继续把重点放在推进字节跳动公司上市的事情中了！

其实之前写的一篇论文还在投稿中。希望它最终能够发表，给这个博客的学术分类下再加一篇内容。

再往后，这个博客学术方面的内容恐怕真的不会有更新了，不过，谁知道呢？

算法研发的关键节点

2022-01-17T06:00:00+08:00

在公司内典型的算法研发会经历以下阶段：问题调研、算法设计实现、收益预估、部署和测试、A/B实验开启、A/B实验正向、上线。

七个阶段

问题调研

弄清楚问题的定义，比如优化目标是什么，有哪些可调整的变量。

另外也需要明确现状以及可改进方向。

算法设计实现

设计新方法来更好地解决问题，例如变量如何调整。

这一阶段的结果是确定可行的优化方案。

收益预估

在发起工程配合之前，通过线下仿真或测试等手段表明新的算法会有收益。

最好给出量化的预估，例如某个指标具体提升多少。

部署和测试

对于服务端，将服务搭建运行起来，提供可调用的接口。对于客户端，集成到SDK或App，生成某个版本。各环节联调跑通，完成上线前的测试，能够发布。

这部分开始，需要算法工程师和其他开发工程师配合进行了。

A/B实验开启

开启A/B实验意味着工程开发和准备工作均已完成，业务方已经接入，各方合作运转起来。

实验开启后，新算法已经在实际环境生效，虽然流量或覆盖度一开始还比较小。

A/B实验正向

实验进行过程中可能需要根据结果进行多次的归因和迭代。迭代过程可能包括上述各个阶段新的更改。

如果算法真的可靠，最终实验应该取得正向收益，达到上线条件。

上线

脱离实验状态，新算法全量生效，得到实际收益，成为新的“现状”。

这是本轮算法研发的终点。虽然有时只能针对拆分出的部分子集上线，不过也算是告一段落了。

后续可以进行新一轮算法研发，可以认为重新经历以上的各个阶段。

四个完成时间节点

上述七个阶段每个都有起始时间。下一阶段的开始不一定需要等上一阶段结束，但这些阶段的完成时间一般是按先后顺序的。另外，算法设计实现、收益预估大多可以一起完成；部署和测试、A/B实验开启大多可以一起完成；A/B实验正向、上线通常情况下也是相差不远的。因此也可以简化为以下四个关键的完成节点：

完成问题调研；
完成算法设计和收益预估；
完成部署和实验开启；
完成实验正向并上线。

如果各个节点都按时完成，也就实现了祝词中常说的：工作顺利！

顺便也祝身体健康。

更好的一年

2021-12-31T06:00:00+08:00

去年是不平常的一年。今年是更好的一年。

修身

毕业工作几年后重读博士后，可以说是对我自身的再次历练。好在学术研究工作还算顺利，新撰写的两篇论文在这一年都已经发表或被录用了。博士后所需的成果已经达成，中期答辩还获得了“优”的评价。一些锦上添花的事，比如博士后科学基金申请以及博士后创新大赛，没能添上去。不过这条锦呢，也差不多可以了！

论文工作告一段落后，我重新捡回了公司这边的事情，入手做的就是将论文里的算法在我司产品上线。能把算法写成论文发表，之后又能亲手推动其落地应用，这应该说是研发人员最好的自我实现了吧。

齐家

年初的时候，我们搬进了新买的房子。新家在海淀黄庄，位置在中关村大街和知春路的交汇处。从清华西门出来，踏上中关村北大街，来到街对面的北大东门，构成了我来北京之后的9年求学之缩影。而知春路则是我毕业后主要雇主字节跳动公司的代名词，毕竟有句话大意是说“走过知春的路，就是字节的人”。来我司后换过4个工区，都是在知春路两侧徘徊，所以干脆把房子也买在了知春路。

住进新房后，智能家居用了起来。今年夏天娃也上了小区内的幼儿园，接送只需要下楼即可。上班可以走路，周末附近也有处玩。总体上家庭幸福感满满。

住自己的房子相比于租房确实会更有动手布置和改造的欲望。比如最近专门买了电钻工具，能够自行安装家具了；甚至还把原来装修的传统墙壁开关拆掉换成了智能开关。满满打造属于自己的小窝，也是一种乐趣啊。

读十本书

2021年的读书很有特色。2020年读10本书的目标没有完成，不过今年在没定目标的情况下恰好读完了10本，而且这10本全都是英文！

毕竟要写英文论文嘛，不读点英文书怎么能行！

行万里路

近两年受疫情影响，出去玩的次数明显减少。不过2021年还是有两次大的旅行具有特殊的意义。

第一次是趁五一假期带着老婆孩子去广州和三亚玩了9天。这是小孩子第一次坐飞机。我们以休闲度假为主，在三亚的沙滩酒店舒舒服服地待了几天。

画风是这样的：

第二次是我“抛弃”家人沿G7京新高速自驾去了西部。G7自驾之旅从2019年就开始计划了，一直拖到今年才算成行。沿着G7，一路向西，想要的就是那种在路上的感觉：

第一次出行，我们离开广州没多久，广州就发生了疫情病例；第二次出行，我刚从西部回到北京，路过的几大省市（尤其是额济纳旗）几乎都爆发疫情成为了风险区。两次都与风险擦肩而过，也算是2021年的幸运。

可见，更好的一年它能有多好。

孟正则4岁啦

2021-11-06T21:00:00+08:00