这天是元旦放假,我起的比平时更晚一些。家里人又把午饭早早做好,于是上午还没怎么过就过去了。 吃完午饭十二点多,我带着正正(我家大娃)出去玩。
翠翠(也就是娃他妈)在家带另一个娃。我们才生了二胎不久,如今老二才半岁左右,两个孩子一般都是这样分开来带。 翠翠不止一次说,等冬去春来,我们就可以一起带俩孩子出去玩了。不过这要等到半年后了。
正正还不饿,所以没吃午饭。临出门时,翠翠说,你们玩一个多小时就回来吧,再做饭给正正吃。 我说,看情况吧,或者就在外面吃。
我们出去时带了跳绳。翠翠给正正报了跳绳的培训班,最近一直在督促孩子练习。 他们母子约定好,如果正正一分钟跳绳超过了一百次,就可以去游戏厅玩。 我带正正来到小区外的广场,热身后,就开始给他计时跳绳。他努力跳,果然一分钟跳了一百次! 于是我们把视频发给翠翠看过,就去游戏厅了。
我们在附近商场的游戏厅玩了大概半个小时。去之前翠翠嘱咐说,不要在室内多待,否则对眼睛不好,玩一会儿就早点出去吧。 可是在出去的路上,我们遇到了商场举办的新年活动。这个活动需要在商场内四处寻找任务并完成,通关后奖励一张彩票。 正正很感兴趣,我就和他一起参加了。我们大概花了一个小时完成,最后的彩票还幸运地中奖了20元。
从商场出来,已经下午三点多了。正正肚子饿了,也不想回家吃饭,我们就决定在外面吃。我要带他去武圣羊汤,我们前几天去过一次,正正还挺喜欢。 翠翠说正正还在咳嗽,不适合去这个,不如去旁边的庆丰包子铺。但我们终究没听,还是去喝了羊汤。
回家的时候已经快到碗饭时间。吃完晚饭,换成我带老二,翠翠辅导正正学习。学习时间从七点半持续到八点半,这期间我抱着老二听广播。 老大学完习,刷牙洗脚睡觉。我们把老二也哄睡后,就晚上十点多了,然后各自玩会儿,一天就结束了。
大部分时候生活就是这样的流水账。
]]>名不正则言不顺,言不顺则事不成。虽然原话中“名”指的是名义,但换成名称也适用。 名称没定好,可能是事情没想清楚,无论是写代码时的变量或函数,还是组织架构中的部门或团队。
写双月OKR时罗列一堆想做的事,结果也都未完成,下个双月只能继续罗列,这是否会给人一种“圈地”或“占坑”的感觉? 写进OKR的是要重点做,不写进OKR并不意味着不做。
一个游戏,如果只能靠堆时间刷经验才能通关,无法通过好的技能、装备配置去获得优势,那这个游戏估计好玩不到哪里去。 一个公司或组织,如果只能靠上班时长和工作年限才能上位,那这个公司估计也没啥吸引力。
记得谁说过,成功晋升的三个条件:首先你要行,其次要有人说你行,再者说你行的人要行。
初级者立功,实现功能;中级者立言,撰写文档;高级者立德,积攒人气。
努力使自己更容易替代——代码清晰,文档清楚,写好README,便于他人接手,最终反而不被替代。
删除代码对能力要求更高。初级工程师只敢添加,中级工程师则开始修改,高级工程师要敢于删除。
基调、节奏、靠谱、和谐,“写一首皆大欢喜的歌是越来越难”。
坚持更新博客也是越来越难啊。
]]>普通用户初见的ChatGPT是一个聊天机器人,或者智能助理。它能回答各种问题,并基于此帮人做各种事情。下面是个例子。
和Siri不同,它无法解决“今天天气怎样?”甚至“现在几点?”这样的问题。 因为它缺乏2022年及之后的信息,并且不具备实时查询或搜索的能力。
用于实现上述聊天功能的是OpenAI提供的编程接口。
调用示例:
# Note: you need to be using OpenAI Python v0.27.0 for the code below to work
import openai
openai.ChatCompletion.create(
model="gpt-3.5-turbo",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Who won the world series in 2020?"},
{"role": "assistant", "content": "The Los Angeles Dodgers won the World Series in 2020."},
{"role": "user", "content": "Where was it played?"}
]
)
返回结果:
{
'id': 'chatcmpl-6p9XYPYSTTRi0xEviKjjilqrWU2Ve',
'object': 'chat.completion',
'created': 1677649420,
'model': 'gpt-3.5-turbo',
'usage': {'prompt_tokens': 56, 'completion_tokens': 31, 'total_tokens': 87},
'choices': [
{
'message': {
'role': 'assistant',
'content': 'The 2020 World Series was played in Arlington, Texas at the Globe Life Field, which was the new home stadium for the Texas Rangers.'},
'finish_reason': 'stop',
'index': 0
}
]
}
message
中的任意字符(role、content等)都占用token数。一个token对应一个英文单词,或者(如果单词较长)一个单词中的一部分。
输入加输出的token数量上限为4096,对应英文词数为3000左右;超出的会被截断。
调用时需要包含历史消息才能取得好的效果,尤其当上下文是必要的时候。例如上述消息“Where was it played?”中it的理解就依赖上下文。
另有输入参数temperature
,用于控制结果的随机性,设为0则每次返回一样,大于0的值可以避免千篇一律。
所谓语言模型,就是对真实自然语言的数学建模。该模型接收给定的输入文本序列,预测接下来会出现什么字符(给出出现各个字符的概率分布)或字符串。
例如输入:
As Descartes said, I think, therefore,
模型输出:
I am.
从而补全了“如笛卡尔所说,我思,故我在。”这一英文句子。
这是语言模型的典型应用方式:输入引导词/提示(prompt),由模型接着做补全(completion)。 如果引导词设计合理,且补全做的很智能,则可以用于解决自然语言处理(NLP)的各项任务。 这里既包含文本理解,也包含文本生成。如何适配特定任务就变成了如何进行“引导词设计”。 “不是AI回答的不好,是我提问的方式不对”就源于此意。
下面是一些NLP任务引导词的例子。
分类:
Decide whether a Tweet's sentiment is positive, neutral, or negative.
Tweet: I loved the new Batman movie!
Sentiment:
翻译:
Translate this into French, Spanish and Japanese:
What rooms do you have available?
问答:
The following is a conversation with an AI assistant. The assistant is helpful, creative, clever, and very friendly.
Human: Hello, who are you?
AI: I am an AI created by OpenAI. How can I help you today?
Human:
对这些引导词内容的成功续写,就是我们想要的任务结果。
ChatGPT本质上就是一个超大规模的语言模型。它对外展示的聊天(chat)功能也是基于强大的“引导词+补全”机制来实现。
大规模语言模型(Large Language Model,LLM)中的“大”体现在训练采用的语料多、模型参数多等方面。ChatGPT属于GPT系列模型中的第3.5代。 该系列从第一代GPT-1开始,规模就在几十成百成倍地增长。如下表所示:
发布时间 | 模型参数量 | 预训练数据大小 | |
---|---|---|---|
GPT-1: | 2018年6月 | 1.17 亿 | 5 GB |
GPT-2: | 2019年2月 | 15 亿 | 40 GB |
GPT-3: | 2020年5月 | 1750 亿 | 45 TB |
GPT全称为Generative Pre-Training,源于论文《Improving Language Understanding by Generative Pre-Training》。 其提出将NLP任务的解决方法从监督学习(需要大量标注数据)演进为半监督学习:先从大量无标注语料得到任务无关的预训练模型,然后用任务相关的标注数据做微调(fine-tune)。
论文中的下面两幅图展示了方法的架构和效果。
可以看到,GPT采用了transformer架构。 该架构中encoder来理解输入,decoder来生成输出,并且通过attention机制能覆盖到更长/更远的上下文信息。
GPT-2和GPT-3除了模型规模的增大,在预训练之后不再针对特定任务进行微调,而是直接用无监督训练出来的语言模型,通过“引导词+补全”的方式来完成各项任务。
在GPT-3的论文《Language Models are Few-Shot Learners》中,引导词所包含的提示信息又分为了以下三种程度:
对于Few-Shot的情况,它相当于是把给出的几个例子作为标注数据进行了简单的fine-tune。在OpenAI提供的API中,也支持自行上传更多标注数据进行fine-tune以更好解决特定任务。
GPT-3能够理解任务描述并较好完成,部分表现已经超过监督学习的模型。这得益于它使用的海量预训练语料,包括:
GPT-3的优化目标是补全的文字更符合统计概率,但结果不一定是人想要的。 其改进版InstructGPT则通过加入监督学习和人工反馈,使语言模型的输出更符合人的意图。这称为对齐(alignment)。
例如下面的对比中,GPT-3的回答明显像是从一些出题或问答类网站上学到了频繁出现的套话,而不像InstructGPT那样是我们想要的回复。
InstructGPT的具体训练方法如下图所示(来自论文《Training language models to follow instructions with human feedback》)。
主要包括三个部分:
ChatGPT和InstructGPT采用了同样的方法,只是数据采集方式稍有不同。 此外,ChatGPT在发布后的持续迭代中,加入了内容过滤等安全机制,减少了有害内容。
或许,教模型不该说什么,和教它该说什么一样充满挑战性。
ChatGPT发布以后,它相关的扩展能力也逐渐成熟可用(虽然有些还处于beta版):
近日,ChatGPT的下一代GPT-4发布,包括了以下几个新特性。
一、将token上限提升至8192甚至32768(约支持2万多单词),可以处理更复杂的任务了。
二、新增了图片的读取和理解,能解下面这样截图给它的题目。
三、加强了可操纵性,可以指定模型表现为特定“人格”。例如前面API部分有 {“role”: “system”, “content”: “You are a helpful assistant.”}这样的系统信息,用于指定该模型为回答问题的助手。 在GPT-4中,该功能得到强化。例如我们可以将系统信息换为”You are a tutor that always responds in the Socratic style. You never give the student the answer, but always try to ask just the right question to help them learn to think for themselves.”,来指定模型的回复风格为“苏格拉底式”,也就是不直接回答问题,而只通过反问来引导提问者自己思考解决问题。
看来,AI不仅可以表现得像人,还能像不同的人。
]]>但这篇要发的文章呢,却是我在2020年初,加入字节3年多一点的时候写的。 当时字节跳动成立8周年,创始人张一鸣发了封题为《字节跳动8周年:往事可以回首,当下更需专注,未来值得期待》的全员信。 我仿照这封信,写下了自己的《入职字节3周年》。
下面正文和引用里分别贴的就是我和一鸣各自写的内容,对照阅读最佳。
今天是我加入公司3周年多一点儿的日子。在这个远程办公的新模式下,我在线上跟大家聊聊新想法。
今天是公司创立8周年的日子。在这个远程办公的新模式下,我在线上跟大家聊聊新想法。
我想在这个时间节点做一个比较大的工作调整:最近,我准备加入字节博士后工作站,联合北京大学进行基于大数据的视频播放体验优化项目。作为字节跳动首批博士后,接下来我会花更多时间精力在学术和前沿研究,侧重论文和专利等知识产权积累,也帮助接替我之前的技术落地和业务支持工作的同事更好地融入。
我想在这个时间节点做一个比较大的组织升级:今天,公司会任命张利东和张楠(Kelly)分别为字节跳动中国董事长和CEO,整体负责字节跳动中国业务的发展。作为字节跳动全球CEO,接下来我会花更多时间精力在欧美和其它市场,和Alex一起把字节跳动全球管理团队完善,也帮助新加入的ErichAndersen、Roland Cloutier等更多同事更好的融入。
过去3年,字节跳动飞速发展,我所在团队已经从一个小组,扩展为给更多业务提供视频和图片相关技术的大平台,团队人数今年也达到了近千人。在成长道路上,我遇到很多的挑战。
过去8年,字节跳动飞速发展,我们已经从一个小产品,成长为给全球用户提供多个产品服务的大平台,全球员工人数今年也将达到10万人。在成长道路上,我们遇到很多的挑战。
为了应对业务的变化,我一直在个人能力和所负责事情上不断提升和适应。比如,从专注算法到参与平台建设;从写模块代码到进行架构设计;项目管理和沟通协调类工作也不断增多。但如何达成视频端到端系统更大范畴的优化目标,对我来说,还是新的课题。
为了应对业务的变化,我们一直在公司组织和合作方式上不断优化调整。比如,明确主要业务的CEO和管理团队;建立各业务虚拟的P&L,帮助各业务更好的做决策;绩效管理和OKR工具也不断更新。但如何建立好一个超大型全球化组织,对我们来说,还是新的课题。
随着业务接触变多,工作内容不断复杂,上级也对我提出了更多要求。过去一段时间,我经历了不少流程。除了绩效评估和调级调薪,还有部门组织架构调整,有人员的转岗和变动。我对个人成长和团队发展的关系有了更深刻的理解。我们年轻人有能力有理想,要认真思考和同事的关系,对团队的贡献。
随着业务的变大,外部效应也不断扩大,社会也对我们有了更多期待。过去一年,我花了近2/3时间去了全球很多地方。除了了解公司业务,我还跟很多当地的同事和朋友交流,去德里迪利哈特市集做用户调研,去巴黎朋友家做客,去各地博物馆了解历史,我对世界的丰富性和文明的演化有了更深刻的理解。我们在全球多个国家有业务有用户,要更认真思考和外部世界的关系,对外部世界的贡献。
不止于此,在我比较熟悉的多媒体处理平台业务之外,我也开始推进更偏下游播放端的策略。对我来说,这是一种扩展,但我对播放策略前沿算法的积累还不是很够。
不止于此,在我们比较熟悉的信息和内容平台业务之外,我们也开始探索很多全新业务的方向。对我们来说,这是一种跨界,但我们对于这些新业务的认知还远远不够。
这些挑战要求我的能力塑造有更多方面。除了项目推动和团队建设,我会从之前已有日常工作中腾出精力来,重点关注几个事情:
这些挑战要求我们公司的组织方式有更多变化,除了完善全球管理团队工作,我会从公司日常运营中腾出精力来,重点关注几个事情:
1、研究如何更好优化视频播放体验
1、研究如何更好地改进超大型全球化组织的管理
坦白讲,在复杂多变的网络状况和各种各样的业务场景下优化视频播放,并不容易。这还不包括,不同用户对体验的偏好或许也有差异。过去一段时间,我们已经感受到不少遇到瓶颈的问题,最直接的体现是业界和学术界对传统视频自适应码率的兴趣下降了。
坦白讲,管理一个在30个国家,180多个城市,有超过6万名员工的公司,并不容易。这还不包括,我们教育业务在北美的5000位外教,公司行政体系的外包员工等等。过去一年,我们已经看到了不少管理问题,最直接的反馈是员工敬业度和满意度统计结果下降了。
我争取在未来两年调研清楚最近的相关工作论文,了解业界也学习学术界前沿进展。我们的目标不仅是提出新的算法,更是提出新的架构和优化体系。通过更好的系统,丰富每个视频播放策略的优化手段和可用信息,提升用户体验。
我争取在未来三年走遍所有有办公室的地区,了解公司也学习当地文化。我们的目标不仅是建立全球化的业务,更是建立全球化的多元兼容的组织。通过更好的组织,激发每个人的潜能和创造力,服务全球用户。
我们一直说improve Quality of Experience (QoE),理解体验质量和服务质量的关系模型是什么,对提升体验很重要。
我们一直说develop a company as a product,理解公司这个产品的本质是什么,对改进管理很重要。
2016年之前我看很多东西,也有很多思考,并在自己的工作中进行实践。在公司已经落地应用的HEVC/H.265编码格式,来源于我理解最新视频编码标准反复强烈的强调——压缩降低视频带宽成本。“通过增加计算复杂度,换取压缩效率”,这是视频编码标准的一贯套路。HEVC/H.265标准的定稿,启发了我对其成本节省空间的重视和在字节的实践。DASH标准的发布,促使我思考视频系统演进方向是什么,以及如何从传输格式方面升级公司流媒体技术体系。我坚持的“先跑通,再做优化”的理念,受到开源项目的直接影响。当然也很大程度上跟我们一开始没有人力做到最优的实际情况有关,我认识到快速尝试、逐步迭代的重要性。
2016年之前我看很多东西,也有很多思考,并且在我们公司管理中进行实践。字节范中的坦诚清晰,来源于我试图理解杰克韦尔奇在《赢》中反复强烈的强调——坦诚降低组织交易成本。“知识型组织中,每一个人都是管理者”,这是德鲁克关于管理者的重新定义。他对于目标管理的思考,启发了我们对于组织有效性的重视和OKR的实践。他和科斯的想法,促使我思考企业边界是什么,以及如何从外部视角衡量组织内部的交易成本。我们坚持的“context, not control” 的理念,受到Netflix的直接影响。当然也很大程度上跟哈耶克关于理性的自负的论述有关,我认识到信息透明、分布式决策和创新的重要性。
公司和团队变大,会带来很多新的变化。在技术布局、事情优先级、分工协作上都有体现。事情上,如何看待使用开源和进行自研,在二者之间应该如何取舍权衡;分工上,在算法、组件和系统三个层面交叉下应该如何配合。当然相应的,公司高阶人才也需要去扩展新的领域。对我们来说,过去两年,其实是落地多创新少。我之后会花更多时间探索研究,也和高校的老师一起联合创新。
科技公司组织方式变化,会带来很多新的变化,在业务、财务、人力方面都有体现。财务上,如何把UG中的LTV引入内部财务报表,各个业务之间应该如何结算成本。人力上,在职能、业务、市场三个维度交叉下应该如何组织人才。当然相应的,企业内部工具也需要新的研发优化。对我们来说,过去两年,其实是问题多思考少。我之后会花更多时间学习研究,也和ES的同事一起讨论提升。
2、研究数据如何创造更大的价值
2、研究科技公司如何创造更多的社会价值
去年下半年开始,我和团队成员重新认真讨论后续的规划是什么。我们是从更广的范畴开始讨论的。什么是数据,什么是数据驱动?为什么数据驱动会带来更多优化收益?数据是“a collection of discrete values that convey information, describing quantity, quality, fact, statistics, other basic units of meaning, or simply sequences of symbols that may be further interpreted”,能实现数据驱动的基础条件是不断积累和理解“values that convey information”。数据驱动如果能不断优化视频播放策略,其价值就会越来越大,影响力也会越来越广。
去年下半年开始,我和管理团队重新认真讨论公司的本质是什么。我们是从最基础的问题开始讨论的。什么是科技,什么是科技公司?为什么科技公司需要承担更多社会责任?科技是指the application of scientific knowledge for practical purposes, especially in industry,能成为科技公司的基础条件是不断的学习 scientific knowledge。科技公司如果能不断提升认知改进方法,其杠杆就会越来越大,头部公司在经济中的占比越来越高,对人们生活的影响会越来越大,也越来越受到监管关注。
从外部来讲,用户对视频产品的体验要求越来越高。从内部来讲,团队成员也需要更多事情去创造绩效。为用户提供最好的视频播放体验,这是我们做视频技术中台的的责任。但是我们还要思考如何在已有现状下进一步突破,积极结合算法和大数据,创造新的价值。
从外部来讲,公众期待会越来越高,从内部来说,员工也需要更强的使命感来承担更大的责任。为用户提供创新、高品质、有效率的产品和服务,这是企业基础的社会责任。但是科技公司还要思考如何面对自己的外部效应,积极和外部各方合作,创造社会价值。
过去一年,我们在多媒体大数据方向做了很多工作,包括建立数据通路,要求每个业务线上报端到端数据。数据收集、展示、分析等几个环节很成功,但总体我感觉还不够,尤其是和我们要驱动策略算法迭代优化的目标相比。
过去两年,我们在企业社会责任方向做了很多工作,包括建立公益部门,要求每一个业务都有CSR的目标和规划,和用户目标、商业目标并列。寻人、助医、扶贫等几个项目很成功,但总体我感觉还远不够,尤其是和我们要在全球范围达到较高的水平的目标相比。
我会和更多的同事以及外部交流,一方面更好地了解学术前沿的进展,一方面探索如何在公司内建立更好的机制去体现更多数据价值。
我会和更多的同事以及外部交流,一方面更好地了解世界当下的问题,一方面探讨如何在公司内建立更好的机制去承担更多社会责任。
3、思考和规划个性化播放等新算法方向
3、思考和规划教育等新战略方向
短视频播放是抖音产品成功的基础。大家应该了解,我司一直很重视推荐技术,对个性化的潜力充满期待。我认同这个方向,对视频产品来说,推荐的意义,是通过这个方式来满足不同用户对内容的偏好。我会再加上另外一点——除了推荐观看哪些视频,还应该推荐如何播放。对的,优化播放体验可以采用和优化内容一样的思路:personalized recommendation。
教育是公司跨界尝试的新业务方向。大家应该了解,我一直很重视人才招聘,对个人的潜力充满期待。 我认同德鲁克的说法,对于公司内部来说,公司存在的意义,是通过公司这个方式实现人们的创造力。我会再加上另外一句——让每个人有更丰富有意义的经历和体验。对的,和我们用户产品的使命一样:inspire creativity, enrich life.
2019年有一段时间,我发现和高校合作中不少成果都来自对大数据的分析。我特地去北大拜访了几位老师。从基于数据的分析成果,以及对公司所擅长的推荐技术的调研,让我直接认识到个性化对持续提升用户体验非常关键,而且体验模型本身也有改进空间。这算是我准备开始研究工作的一个起点吧。过去两年中,我跟进过不少高校合作,包括在不同论文中作为不同排名的作者,但因为时间精力有限,不够持续。接下来,我会更侧重创新的研究。
2016年有一段时间,我发现公司好多优秀的算法人才都来自上海交大ACM班,我特地去上海拜访了俞勇老师。从交大ACM班的成材率,以及后来对Minerva University的调研,让我直接认知到教育对激发人的潜力非常关键,并且教育本身也还有巨大的潜力。这算是我认真思考教育业务的一个起点吧。过去两年中,我访谈过不少老师学生,包括到不同课堂体验不同的教学效果,但因为时间精力有限,不够持续。接下来,我会重启对教育的访谈观察。
最近字节发展非常快,很多人考虑自己后续的职业发展。我其实不焦虑,有耐心,我觉得现在视频播放体验还没做到极致,优化算法必须有更根本的创新,当然前提是我们有更多的探索投入。尤其对技术领域差不多定型的员工来说,启动新方向是不容易的,有惯性也有惰性。在新的领域大胆的尝试,是始终创业的重要标志。
最近在线辅导市场非常热,很多人问我公司的业务进展。我其实不焦虑,有耐心,我觉得现在还是很早期,教育业务必须有更根本的创新,当然前提是我们有更深刻的认知。尤其对于已有成功业务的公司来说,启动新业务是不容易的,有惯性也有惰性。在新的领域大胆的尝试,是始终创业的重要标志。
三周年之际愿大家:往事可以回首,当下更需专注,未来值得期待。
八周年之际愿大家:往事可以回首,当下更需专注,未来值得期待。
从2020年到现在,几年已经又过去了,我博士后已经出站,并且继续在字节供职。 在这个入职周年的日子,不妨再说一次:“往事可以回首,当下更需专注,未来值得期待”。
]]>大部分情况下,准确性倒没啥问题。不过下面给出的这个例子,已经影响到对作者意思的理解了。 我在读这部分中文的时候没读懂,还特意去找了原文来看才明白。
这是作者分成序和跋两部分(分开写在书的前面和后面)讲的一个小故事。 故事讲述在“超子电脑”发布会上,总设计师让现场观众问该电脑一个问题,从而启动它。
序的最后写到:
……
“可是必须得有一个人来提问呀?”总设计师请求大家。可是大家都害怕,似乎感到了一个新的全权的威慑。 亚当可没有这种恐惧。 他和电脑一起成长的,他几乎知道作为一台电脑它可能会怎样感觉。 至少他自认为他可能知道,不管怎样,他总是好奇。亚当举起手来。
“呕,好的,”总设计师说道,“第三排的这位小青年,你要向我们的新朋友提个问题,是吗?”
到这里就没往下讲,而是先开始正文了。等正文结束后,跋的部分接着写了如下内容:
“感觉像是?嗯⋯⋯一个最有趣的问题,我的年轻人。嗯,⋯⋯我自己也想知道答案,”这位总设计师说道, “让我们来看看我们的朋友对这问题怎么说⋯⋯真奇怪⋯⋯呃⋯⋯超子电脑说它不知道⋯⋯它甚至不能理解你想问的是什么!” 会堂里的笑浪声终于爆发成大笑。
亚当感到非常难为情。不管他们做出什么,他们都不应当笑啊。
作者特意在中间略去了小男孩亚当的问题。不过从翻译的文本来看,很难知道他问了啥。我读了原文后,才清楚多了。对应的英文原文如下。
……
“Surely there must be someone?” he pleaded. But all were afraid, seeming to sense a new and all-powerful consciousness. Adam did not feel the same awe. He had grown up with computers since birth. He almost knew what it might feel like to be a computer. At least he thought perhaps he did. Anyway, he was curious. Adam raised his hand.
“Ah yes,” said the Chief Designer, “the little lad in the third row. You have a question for our ah- new friend? “
(特意留白)
“FEEL LIKE? Oh, a most interesting question, my lad. Er, rather like to know the answer to that myself”, said the Chief Designer. “Let’s see what our friend has to say about… that’s odder … Ultronic says it doesn’t see what… it can’t even understand what you’re getting at!” The ripples of laughter about the room burst into a roar.
Adam felt acutely embarrassed. Whatever they should have done, they should not have laughed.
我个人觉得翻译不妥的地方主要在于下面这部分:
“He had grown up with computers since birth. He almost knew what it might feel like to be a computer. At least he thought perhaps he did. Anyway, he was curious. Adam raised his hand.”
这几句之间其实是有连贯性表意的。我来翻译的话会是:
“他自打出生起就伴随着电脑一块儿长大,因此他几乎知道作为一台电脑会是什么感觉了。至少他自己觉得知道了。不管怎样,他想弄清楚。于是他举起了手。”
然后再结合设计师的回应(“FEEL LIKE? Oh, a most interesting question, my lad. Er, rather like to know the answer to that myself” / “什么感觉?嗯,相当有意思的问题啊,小伙子。我本人也想知道答案呢”), 就能比较容易猜出小男孩问的问题是:“作为一台电脑是什么感觉呢(What doest it feel like to be a computer)?”
此外,还存在其他一些小问题,例如“most interesting”中的“most”不应理解为“最”,对“lad”的翻译前后不一致,等等。这都体现出原翻译的不给力。
本书作者在序的部分写完后,正文第一章的标题是“CAN A COMPUTER HAVE A MIND? ”。其实如果暗指这就是小男孩的问题,从形式上看倒是挺巧妙。 不过这和跋部分开头的“FEEL LIKE?“对应不上,所以也只能排除这一解释。作者当时究竟真实意图如何,我也不得而知了。
最后提一句,我在读的另一本书《哥德尔、艾舍尔、巴赫——集异璧之大成》,看上去翻译得就很好。毕竟其译者和作者还专门就翻译相关问题进行过深入的沟通交流。
]]>“四大班子”一般是指党委、人大、政府、政协这四个重要机构的领导。下面分别介绍这四个机构。
党委是中国共产党从中央到地方的各级委员会。下面主要说中央,地方的类似。
党的中央委员会由每5年一届的党的全国代表大会选举产生。 前面提到的二十大就是指党的第二十次全国代表大会。 在党的全国代表大会上,来自全国各地的党代表共两千多人,选举出二百多位中央委员会委员。 在这一届的5年间,中央委员会每年召开一次全体会议,共开5次。例如十八届三中全会,就是其中的第三次。 每一届的一中全会一般紧接着10月份的全国代表大会召开,选举出中央政治局委员(二十几人)、中央政治局常务委员(几人),然后从中央政治局常务委员中选出中央委员会总书记,并确定书记处、中央军委、中央纪检委等其他重要结构成员。 在中央委员会闭会期间,中央政治局和它的常委就以书记处为办事机构,来具体领导工作和行使职权了。
人大是人民代表大会的简称,全国和地方都同样举办。相比于党的全国代表大会是仅限于党员的党内会议,人大是全部人民的会议。 每年的“两会”就是指基本同期召开的人大会议和下面要说的政协会议。 全国人大每届任期5年,每年举办一次全员会议(一般是每年的3月份),共有代表3千人左右。 在第一次全员会议上,选举出本届的人大常务委员会,作为其常设机关行使职权;另外也会选举出国家主席、最高检、最高法院长等国家级领导。 之后的几次全员会议上会进行政府工作报告等每年例行事宜。
人大常务委员作为常设机关,共二百人左右,每年要开几次会议,进行立法等具体工作,也负责每次人大全体会议的召集。
政府是由人大选出、具体办事的行政机关,从国务院到地方政府,分为部、局、处、科等各级单位。 这个体系相对更为人所熟悉一些,就不再赘述了。
政协全称是中国人民政治协商会议,是中国共产党领导下的统一战线组织。顾名思义,其目的主要是促进多党合作和政治协商。 政协的委员会组织形式和时间基本上和人大是一样的。每届全国政协委员两千多人,常务委员三百人左右。 除了包含党派外,政协还设置有妇联、共青团、科学技术协会、体育界、宗教界、台湾同胞联谊会等几十个“界别”。
各级政协中,党外代表人士占有较大比例(不少于60%),这也使政协成为四大班子中唯一不以中国共产党党员为主的机构。
]]>相比于《血源诅咒》,我对《黑暗之魂》并没有投入那么多精力(同时也是因为后者的体系更庞大些),所以整理的结果也相对更加粗糙和零散些。
最初,世界由巨蛇占据。后来初火显现,并随之出现了四个王魂(Lord Souls)。游戏标题黑暗之魂就是其中之一。
这四个王魂被四人分别拥有,他们共同战胜了巨蛇,然后建立了四个王国,称为初始四王。这便是火之时代(The Age of Fire)的开始。
然而随着时间推移,初火慢慢将要熄灭。初始四王之一的格温,不愿看到火灭,一直尝试传火。
代代相传的延续初火过程中,出现了黑暗印记(Darksign)诅咒。有此诅咒的人,每当死去就会复活(在篝火处重生),并逐渐失去人性,变成活尸(Hollow)。他们被称为不死人。
游戏的主角就是这样一个不死人。他被引领去继承格温的传火大业。不过玩家也可以在结局选择灭火,彻底终结传火大业。
传火让人失去人性,或许黑暗才是人的本性……
Gwyn(格温):致力于传火。害怕黑暗来临,亦即黑暗之魂(Dark Soul)的后代占领世界。
Frampt:一个初始巨蛇,和格温同谋,希望传火。
Kaathe:一个初始巨蛇,希望阻止Gwyn,回归黑暗时代,认为这才是自然的本质。
被选中的不死人(The Chosen Undead):魂游戏主角,唤醒Frampt,战胜包括格温在内的初始众神,收集三个王魂,成为新的薪王来传火。
Manus:初始人类;被Kaathe操纵人类唤醒,其人性扰动产生了黑暗的深渊。被打败后灵魂散开,变成了深渊的女儿(Daughters of The Abyss)。人性和黑暗并不是本恶,因被扰动和扭曲才产生了深渊。
Vendrick:想依靠火的力量治好诅咒,建立了Kingdom of Dranglaic,但最终还是没能成功,自己活尸化了。
Nashandra:Vendrick的妻子,其隐藏身份是深渊的女儿(即Manus的灵魂碎片);在王进行传火前窃取其力量,目标是延续黑暗。
Aldia:想通过研究人的本质治好诅咒,最终也没成功,认为活尸才是人本来的状态,人性是短暂的幻象。他称为原罪学者,和Vendrick同属于Kingdom of Dranglaic。他所定义的第一原罪(The First Sin),就是把活尸的本质隐藏,创造人可以死、并非活尸的谎言,让人害怕活尸化。
Vendrick的途径:靠获取火之力量,避免人性的损失;但失去力量就失效了。
Aldia的途径:通过研究,希望能在活尸状态保持理智;认为这才应该是常态。
余火(Ember):剩余的火之力量;可以激发余烬重新燃烧变强。
余烬(Ash):已经燃尽的灰;传火并且被耗尽的弱者;可以被余火激发。
余薪(Cinder):没有燃尽的碳或柴;传火并且活下来的强者。
Ludleth the Exiled:很早之前自愿传火。
Aldrich Saint of the Deep:从噬人到噬神,变强大后被用来传火(并非自愿)。其坚信黑暗时代,想把神都消灭,这样就没有神来维持火的时代了,吞噬了Gwyndolin。
Farron’s Undead Legion of Abyss Watchers:多位一体,共享狼血,防止怪物从深渊出来,发誓传火以对抗深渊。
Yhorm the Giant:希望通过传初火来结束罪业之火。但罪业之火还是烧毁了罪业之都,烧死了除它之外所有人。
Lothric:拒绝传火。
]]>不过从2020年夏开始,我重新入学,进行为期两年的博士后工作,陆续又开始发表学术文章。
今天,博士后工作结束,出站手续完全搞定后,拿到了如下这张博士后证书。
可以继续把重点放在推进字节跳动公司上市的事情中了!
其实之前写的一篇论文还在投稿中。希望它最终能够发表,给这个博客的学术分类下再加一篇内容。
再往后,这个博客学术方面的内容恐怕真的不会有更新了,不过,谁知道呢?
]]>弄清楚问题的定义,比如优化目标是什么,有哪些可调整的变量。
另外也需要明确现状以及可改进方向。
设计新方法来更好地解决问题,例如变量如何调整。
这一阶段的结果是确定可行的优化方案。
在发起工程配合之前,通过线下仿真或测试等手段表明新的算法会有收益。
最好给出量化的预估,例如某个指标具体提升多少。
对于服务端,将服务搭建运行起来,提供可调用的接口。 对于客户端,集成到SDK或App,生成某个版本。 各环节联调跑通,完成上线前的测试,能够发布。
这部分开始,需要算法工程师和其他开发工程师配合进行了。
开启A/B实验意味着工程开发和准备工作均已完成,业务方已经接入,各方合作运转起来。
实验开启后,新算法已经在实际环境生效,虽然流量或覆盖度一开始还比较小。
实验进行过程中可能需要根据结果进行多次的归因和迭代。迭代过程可能包括上述各个阶段新的更改。
如果算法真的可靠,最终实验应该取得正向收益,达到上线条件。
脱离实验状态,新算法全量生效,得到实际收益,成为新的“现状”。
这是本轮算法研发的终点。虽然有时只能针对拆分出的部分子集上线,不过也算是告一段落了。
后续可以进行新一轮算法研发,可以认为重新经历以上的各个阶段。
上述七个阶段每个都有起始时间。 下一阶段的开始不一定需要等上一阶段结束,但这些阶段的完成时间一般是按先后顺序的。 另外,算法设计实现、收益预估大多可以一起完成;部署和测试、A/B实验开启大多可以一起完成;A/B实验正向、上线通常情况下也是相差不远的。 因此也可以简化为以下四个关键的完成节点:
如果各个节点都按时完成,也就实现了祝词中常说的:工作顺利!
顺便也祝身体健康。
]]>毕业工作几年后重读博士后,可以说是对我自身的再次历练。好在学术研究工作还算顺利,新撰写的两篇论文在这一年都已经发表或被录用了。 博士后所需的成果已经达成,中期答辩还获得了“优”的评价。 一些锦上添花的事,比如博士后科学基金申请以及博士后创新大赛,没能添上去。不过这条锦呢,也差不多可以了!
论文工作告一段落后,我重新捡回了公司这边的事情,入手做的就是将论文里的算法在我司产品上线。 能把算法写成论文发表,之后又能亲手推动其落地应用,这应该说是研发人员最好的自我实现了吧。
年初的时候,我们搬进了新买的房子。新家在海淀黄庄,位置在中关村大街和知春路的交汇处。 从清华西门出来,踏上中关村北大街,来到街对面的北大东门,构成了我来北京之后的9年求学之缩影。 而知春路则是我毕业后主要雇主字节跳动公司的代名词,毕竟有句话大意是说“走过知春的路,就是字节的人”。 来我司后换过4个工区,都是在知春路两侧徘徊,所以干脆把房子也买在了知春路。
住进新房后,智能家居用了起来。今年夏天娃也上了小区内的幼儿园,接送只需要下楼即可。 上班可以走路,周末附近也有处玩。总体上家庭幸福感满满。
住自己的房子相比于租房确实会更有动手布置和改造的欲望。比如最近专门买了电钻工具,能够自行安装家具了;甚至还把原来装修的传统墙壁开关拆掉换成了智能开关。 满满打造属于自己的小窝,也是一种乐趣啊。
2021年的读书很有特色。2020年读10本书的目标没有完成,不过今年在没定目标的情况下恰好读完了10本,而且这10本全都是英文!
毕竟要写英文论文嘛,不读点英文书怎么能行!
近两年受疫情影响,出去玩的次数明显减少。不过2021年还是有两次大的旅行具有特殊的意义。
第一次是趁五一假期带着老婆孩子去广州和三亚玩了9天。这是小孩子第一次坐飞机。我们以休闲度假为主,在三亚的沙滩酒店舒舒服服地待了几天。
画风是这样的:
第二次是我“抛弃”家人沿G7京新高速自驾去了西部。G7自驾之旅从2019年就开始计划了,一直拖到今年才算成行。沿着G7,一路向西,想要的就是那种在路上的感觉:
第一次出行,我们离开广州没多久,广州就发生了疫情病例;第二次出行,我刚从西部回到北京,路过的几大省市(尤其是额济纳旗)几乎都爆发疫情成为了风险区。两次都与风险擦肩而过,也算是2021年的幸运。
可见,更好的一年它能有多好。
]]>