2019年5月

起因:

在某一个周末,跟在凡影的工作的前同事小航聊天,说到电影咨询的一些市场基本情况。有一个重要业务是通过问卷调查,研究即将发行的电影,是否受欢迎;也提到现在的剧作者,越来越重视消费者喜欢看什么,IP创作从极个人化的方式向市场导向转变。我结合之前做音乐个性化推荐的经验,提出了一个通过分析剧本的文本,在拍摄之前就大致预测受欢迎程度的思路。

北京凡影科技有限公司(凡影Fanink),电影行业专业的调研公司,很多电影都是他们的客户,比如《流浪地球》

思路:

基本思路是这样,通过分析影史 top1000 的电影剧本得出受欢迎剧本的基本特征,结合对大众对故事性的一般理解和时下风尚,就可以预测新剧本是否欢迎,同理还可以用作网络小说的预测。

什么是好剧本?

一个好剧本,应当是剧作者具备相当的文字功力,会讲故事,台词废话少,能用合理的篇幅表达人物和冲突,总结起来应该具备下面几点:

人物突出

  • 每个场景中出场的人物数量合理
  • 台词集中在主要人物身上
  • 台词符合人物设定

节奏合理

  • 场景数量合适
  • 台词密度合适
  • 冲突段落位置合适

情感传达到位

  • 台词符合剧本基调
  • 人物情感饱满

怎么从剧本文本中判断?

从好剧本的要素来看,需要通过剧本文本判断出很多内容:

  • 人物数量
  • 人物之间的互动频次
  • 场景数量
  • 场景台词密度
  • 场景情感倾向

通过获得大量的剧本文本,通过机器学习的技术,剧本本身的一些规范以及开源的各种NLP库支持,应该是可以识别出来的,我找到了小伙伴振民和晓峰,说起这个基本思路,他们觉得可以业余时间试试看。

阻碍:

现实还是骨感的,我们都不是这个行业里的人,资源和思路上都有局限性。

1、一个电影或者电视剧的流行,剧本很重要,但也只是其中一部分,还要考虑导演、演员、宣发等各要素。
2、优秀的剧作者不需要这种机器分析。
3、最关键的,我们拿不到大量的剧本素材,机器学习无从谈起。

思路转变:

既然剧本拿不到,就只能找一个替代品,我想到的是字幕。字幕文件里有对话文本和对话发生的时间,更接近电影播放时给观众的感受。如果将视频的整个时长当作一条时间线,可以这么看:

1、对话发生的时间区间,将对话发生密集的位置,当作视频核心场景。
2、在核心场景中,计算台词的密度。
3、分析人物数量是比较困难的,准确的需要通过剧本或者分析视频获得。
4、对话中包含大量“你”、“我”、“我们”等代词,可以用来分析对话。

代价也是有的:

1、字幕不包括人物名称,需要单独分析,有相当难度。
2、大量影片的出彩之处是演员的肢体语言和表情,没有台词,也就没有字幕可以分析。
3、场景切换也需要通过其他方式来识别,除非排除“场景”这个要素对剧本质量预测的影响。

实际上,如果有弹幕数据支持,这个分析会更好做,那是B站的活。

工作:

主要的工作都是用振民同学完成的,我们指定了目标网站,购买了服务器,他写了爬虫,去获得字幕和电影评分等数据。其中的过程略去不表,倒是有几个发现:

1、字幕大佬射手网停了,原有的电影和电视剧字幕,也被用作深度学习的训练材料,不过是翻译方向的。
2、并非只有我们想到了分析剧本这个方向,优酷认知实验室有一个叫做鱼脑团队也在做。

不太好的结果:

还是因为我们并没有这方面的经验,彼此的时间也都不可控,断断续续进行了一段时间,进展不理想,距离分析预测剧本还差很远。这不是一个文本相似度的简单计算,而是剧本内容的高度抽象,不花时间思考和实验,不会有好结果。

意外插曲:

中间还发生了一个意外,非常有趣。有一天意外(我确实忘记是从哪里)得到了一个几千部电影字幕的压缩包网盘地址,于是兴致勃勃在服务器上下载回来,结果发现是岛国特产电影的字幕,字幕文件名就是车牌号,本着“下都下好了”的精神,我们决定聚类一下看看会出现什么情况,振民同学在排除掉高频无意义的词之后,得到了28个分组的结果,当然分组内容很有意思,也大都是不可描述的词语。

再次转变的思路:

剧本和电影字幕太复杂了,我们决定从我最熟悉的歌曲角度入手重新设计,歌曲的歌词字数少,对歌曲受欢迎程度的影响更大,且LRC格式的歌词,同样有时间标记。我们干了下面几件事情:

1、因为过去长期在数字音乐领域,很容易就得到了大量的歌词文件。
2、爬了某音乐网站引以为荣的歌曲评论文本。

总的来说,基本假设是歌词的质量和情感倾向,是影响歌曲流行程度的重要因素。歌曲评论的情感倾向,与歌词的情感倾向一致性比较强,也就是说歌词写得好,共鸣更多,更易流行起来。少数收到特定事件和文化背景因素影响的歌曲,歌词与评论的情感倾向可能不一致。

结局:

从希望得到一个剧本预测引擎的初始目的出发,一波三折,最后意外得到了一个歌词流行度预测引擎,考虑到歌手、唱片公司、曲风等要素后,最终得到的预测结果,看起来还是比较合理的。

后记:

这是从文本角度分析的思路,如果讲音乐分拆出来旋律、歌词情感和文化倾向、配器等要素,应该会得到更好的预测分析结果。

本文不包括基本职业素养,如学习能力、激情、敬业、沟通等。一家之言,仅供参考。

需求发现和分析能力

场景不停变化发展,用户需求是动态的,要求产品认知不断迭代,该能力的核心是识别定义需求场景和判断需求满足情况。通常通过用户调研报告、需求分析文档、需求评审文档、项目总结及述职等方式体现出来。

能力同时体现在数量和质量上:

1、数量是指用户需求被发现分析的个数。应考虑到产品不同的发展阶段,成熟产品相对初创产品,需求发现的难度要高,在数量的要求上也不同。

2、质量是指用户需求定义的准确性,包括考察人群覆盖比例,场景和需求的频次,满足程度,简言之是需求的性价比,而不只是需求发现的难度。

人群覆盖比率高,场景频次高,满足程度较大不足才应被纳入能力考察范围。极限情况下需求,用于考察思考完整性和深度,避免需求上的过早过度发现导致产品过早过度设计,造成资源和时间上的巨大浪费。

高质量的需求发现和分析,应符合以下三个要求:

1、直击本质

本质是指事物区别于其他事物,本身所固有的根本的属性。需求的本质指向某个普适性的心智模型,使得用户行为在具体的场景下可以被解释和预测,需求分析是理性科学的,可以被证伪的。避免用“用户偏好不同”来解释“用户行为不同”,“偏好”是个性的,分散的。任何偏离本质,流于表面的分析,都可以在“偏好”的指导下找到自己的解释力,这种万能说法伤害了需求满足的判断标准,使产品失去迭代进化的能力。

2、分析严谨

分析严谨的要求实际上包括了三段:

2.1、分析素材基于事实。分析素材的采集,要求准确(精确且完整,以可以支持分析为限,过于追求精确和完整将失去性价比)和客观(不参杂个人价值判断),是事实而非观点;

2.2、分析过程反映因果关系。需要强调的是相关性与因果性的差异,我们说统计上的正相关性,是指 A 与 B 同时增加或减少的情况,如泳裤与西瓜的销量同时上升,是相关性,而不是因果性。夏季来临,温度上升,人们消暑降温的需求增加,带来了销量增加,才是因果性。

2.3、分析结果可被重复校验。由于现实情况的复杂性,我们很难在每一个需求发现和分析中,都严格追求完美的因果关系,大部分时候,这种分析都是指用户在 A 的场景下,大概率会发生 B,重复多次,重复多人,都不改变这种概率或概率分布。

3、结论合理

应该意识到,结论是有前提条件的,结论指导的产品设计或商业实施,也应该是有可操作性的。假设一个三段论分析:稀有金属很值钱,月球上有很多稀有金属,所以去月球开采稀有金属能很赚钱。这个分析不严谨,结论也不合理,忽略了商业成本和现有技术条件。

从需求发现的深度上,可以层次分为:

1、发现现有产品对现有需求满足不足的地方,包括不限于文案、交互、功能缺失、策略疏漏、分支情况考虑不足等。

2、发现新的需求场景,通过延伸现有策略、功能、产品,可以满足此需求。1和2是基于现状的一种改良。

3、发现新的需求场景,通过新的策略、功能、产品来满足此需求。这是一种创新,容易产生新的业务增长机会,是需求发现和分析能力的最好体现。

从判断需求是否被满足的角度,可以层次分为:

1、不具备量化能力,依赖访谈和个人印象。

2、具备量化能力,量化方法有特殊性,仅用于严格同类型需求的判断。

3、量化方法具备可复制性,可用于指导同类型需求是否被满足的判断。

市场及竞品分析能力

市场与竞品分析能力的核心,是数据采集和结构化能力。通常通过商业分析报告、行业发展调研、竞品分析报告等方式呈现。

分析工具使用

包括不限于波士顿矩阵、波特五力模型、SWOT,使用成熟工具是为了清晰说明问题,依赖工具的分析,只注重了分析过程的逻辑性,而忽视了分析本身的目的是为了指导行动。分析报告是以观点为核心,而不是以使用工具的过程为核心。包含分析工具的报告,可以是这样一个结构:

分析目的 -> 观点 -> 证明观点的逻辑 -> 分析工具/模型对逻辑过程的支持 -> 实施代入分析工具 -> 结论 -> 结论的局限性 -> 校验结论的方法

分析质量

从分析内容完整性要求,应该包括分析目的、市场/竞品情况、对产品的影响广度及深度、应对方案、方案评估方法等。符合内容完整性要求的报告,可作为考察市场及竞品分析能力的重点,也可以针对不同类型的分析报告,设定不同的内容完整性要求。

从分析类型完整性要求,可以包括市场趋势、政策与法规影响、上下游产业链、外部渠道分析、主要竞争对手的规模变化与动作、主要竞品的特点与流程、潜在替代品分析等。产品经理可输出的符合内容完整性要求报告类型越多,越能体现相关能力。

从分析的深度上,可以层次分为:

1、描述型报告,描述市场上正在发生的事实,以及竞品的状态变化,缺少分析框架,主要考察数据收集能力。

2、评估型报告,除覆盖描述型报告的要求外,增加分析框架,可针对少数关键流程/产品特性/市场要素,准确评估外界市场环境和竞品变化对产品的影响。

3、对比型行业报告,除覆盖评估型报告的要求外,设计有针对性的数据采集清洗方法,构建分析工具和方法,相对准确做出中长期市场态势预测,对产品中长期规划提出合理化建议。

从数据有效性的角度,可以考察以下:

1、采集数据的来源和方法。数据来源的丰富性和数据准确性,直接影响到分析的质量,产品经理应掌握各类数据的来源,同时对数据来源的擅长领域、准确性、更新频次、覆盖范围等特点有清醒的认识。来源包括不限于数据分析工具、有关部门权威发布信息、研究机构行业报告、可信个人数据源。

2、清洗数据的能力。主要指从原始数据中分离对市场及竞品分析有用的数据的能力,熟练使用数据分析工具尤佳,包括不限于Excel、SQL、R语言。清洗思路通用性的价值优先于工具技能。

3、数据的呈现能力。数据除及时有效外,还应便于理解,市场及竞品分析中的数据可视化呈现及对分析结论的支持力度,也体现出产品经理理解和表达的能力,属非必要能力。

方案设计能力

业务的复杂性要求产品方案具备多样性,方案设计能力的核心,是抽象业务,并通过功能或流程满足的能力。通常在不同类型的PRD、分享、分析报告中体现。

从方案的类型区分,各种方案的难易度与业务场景有关:

1、靠近直接用户的交互功能设计

交互的操作步骤/操作时间,量化用户体验的方法可以通过搜索得到很多,不赘述;
功能对需求的满足程度,通过NPS考察,关键依然是需求的定义而不是功能点;

2、侧重业务流的操作流程设计方案

正向流程,节点明确,分支流程覆盖全面,使用业务流的各方角色任务划分清晰;
逆向流程,可从任意节点回退流程;
流程相对标准化,新增业务支持改动小;
作业模块简单可微服务化,针对同一要素的操作保持在同一作业模块中处理;

3、提高效率的策略/算法/模型设计方案

策略/算法/模型迭代产生的关键指标增长,在相似增长的情况下,简洁优于复杂;
可解释性高,可向非产品开发角色输出简化包装后的描述,方便理解;
从需求到策略/算法/模型的思考过程清晰,可输出到同类业务;

4、面向营销增长的运营方案设计方案

增长的结果,体现结果导向;
增长的性价比,体现经营思维;
运营方案的可重复性,体现抽象能力;
运营方案的特殊性,包含时机、目标人群、运营动作等,特殊性体现了产品经理对业务特殊性的理解;

5、涉及财务税务法务的支持方案设计方案

容易忽视的方向,通用性强,技术要求高,在考察时需要更多考虑协作方的NPS;
财税法相关的方案,考察数字准确性,对合规要求的支持程度和响应速度;
财务相关工作,存在相当多的可自动化的重复劳动,财务人力投入的减少,也可以作为考察指标之一;

对高阶的产品经理而言,除在方案设计上具备基本的能力外,还应当具备系统化视角,增加产品管理制度、产品架构设计、产品团队结构设计、商业创新设计等。

1、产品管理制度设计方案

包括产品方案设计的基本流程,文档模板,质量检验方法、评审规则等,这些制度设计风方案应当是被实施并取得相应效果的;
制度设计的实施需要得到开发等相关部门的支持,在考察中可以征求相关协作部门的意见;

2、产品架构设计方案

产品线之间的协同设计,考察产品线之间的交互模式;
产品矩阵之间的协同模式设计,考察产品是否形成逻辑自洽,市场反馈良好的网状结构,形成合力推动业务发展;

3、产品团队结构设计方案

产品团队的结构,需要覆盖产品架构设计,通过业务划分和梯队建设设计,在产品人力的投入上保证业务正常,同时需要考虑业务突然增长和人员意外流程产生的风险;
产品团队成长路径设计,在至少未来 6 个月的业务增长假设下,从招聘和成长两个维度建设团队。外部招聘时,可以通过对标内容明星项目和团队,考察高阶产品经理的团队建设方案能力

4、商业创新设计方案

产品反哺商业的方案设计,产品架构是否能容纳商业尝试的不确定性;
是否有产品机制保障商业创新;

方案难易程度的判断点:

1、涉及业务角色数量,难度与数量正相关。

2、涉及功能模块或系统数量,实质上就是方案适用场景的多少,难度与数量正相关。

3、涉及不可控要素数量,且方案可以限制不可控要素对完成度的影响。

4、方案的抽象性,可复制到其他业务场景的可能性越高,难度越大。

以上难易度的考察,受限于具体业务场景,难易考察创新型方案,可以通过建立“明星”方案作为参照物,得到方案的相对难度,逐步建立难易度量化能力。

方案执行能力

方案是否有效,说到底还是要通过实践来检验,执行是设计+实践+迭代的整体过程,执行能力的核心是资源利用和项目管理,项目管理类的资料和书籍非常多,简要说明。通常体现在项目结果中。

1、产品设计方案分拆,边界清晰,执行计划目标明确,milestone设计合理,执行过程可以被持续监督,不断反馈。

2、执行判断力,判断是否执行,判断执行优先级,取舍有方。对高阶产品经理,此项能力的要求更高,同时还需具备向上管理预期,平行协调沟通的能力。

3、产品设计方案资源估算准确,资源包括涉及角色、投入人力、时间等,无需求变更等特殊情况,误差应在10%以内。

4、产品设计方案对合作方的影响及协同方案设计实施能力,要求产品经理除自身负责的模块或产品线外,理解协作模块或产品线的运作方式,在方案设计及执行时,能大致评估出会影响到多少外部模块和产品线,并协调资源处理。

5、进度跟踪,迭代交付能力,重要的是不断反馈和调整,拿到结果。

以上几种能力的考察,主要是通过日常项目进度和结果,协作团队的评价进行。

对高阶产品经理,需要增加设计保证执行的工具,建立保障机制的能力。要求任何一个产品经理都克服一切困难,尤其是克服部门墙和职级差异造成的困难,是不现实的。在多人团队的协作中,除依赖个人执行能力之外,还需要设计和推动标准化流程和协作机制的建立,包括奖惩、指导、总结等环节,减少执行中的不确定性和不必要损耗。这种能力会降低对产品经理个人能力的要求,有利于产品团队产出质量。

商业能力

无论是 toB 还是 toC 的产品,最后都需要商业变现,或者是成为商业生态中的一环,支持商业变现。商业能力的核心是经营思维,通常体现在PRD和项目总结里的成本测算、收益评估等环节,日常工作中反映出来的财务思维也是重要考察项。

1、谈判能力。内部,通过目标协调一致;外部,通过共赢协调一致。谈判的结果,首先是达成合作,然后才是一城一地的得失计算。

2、财务思维。基本读懂财报,知晓复式记账法,了解现金流对公司经营的重要性,理解所有的资金都是有使用成本的,算大账超过算小账。

对高阶产品经理,理解组织的商业模式和收入模式非常重要。商业模式是我们为最终客户提供了什么价值,客户为什么商品付钱;收入模式是谁付钱给我们,让我们提供商品。商品与产品是不同的,整个商业组织的交付物,是交付给客户的商品,而产品经理所做的,是通过“产品”生产“商品”,因此,让“产品”容纳“商品”创新尤为可贵。

指导能力

考察指导能力,是指通过结果考察指导的广度和深度,能力核心是抽象总结和沟通。

指导的广度是指:

1、受指导的直接人数应超过管理的人数,即是指导范围超出管理范围。

2、能力建设和方法总结得当,具备普适性,可影响大部分产品经理,可以通过考察指导人方法论产出、专业领域的专利或业界口碑进行。

指导的深度需要从指导力度和质量来看。指导力度越大,耗时越多,与直接指导人数成反比;指导质量从被指导人的能力进步来判断,通常看被指导人承担项目的难易度增加和晋级情况。

指导力度可分级为:

1、动作指导。指导做什么事务,什么步骤,每一步的做法,指导者监控过程和结果。

2、战术指导。指导做什么事务,分解执行由被指导者完成,指导者评审方案和监控结果。

3、战略指导。指导做什么方向,战略节点、事务分拆都被指导者完成,指导者只监控结果。

4、目标共同体。具备战略建议和决策能力,自下而上提供战术战略,形成目标共同体,不再区分指导者与被指导者,而是合伙人角色。

执行层面的产品经理,应该具备动作指导下一级产品经理的能力,并接受上一级产品经理的战术指导。
有管理职能的产品经理,应该具备战术指导下一级产品经理的能力,并接受上一级产品经理的战略指导。
极少数的资深产品架构师,应该具备指导和培养产品管理者的能力,成为组织的目标共同体。

什么时候需要产品职级

能力的层级任何时候都需要,帮助我们定位自己;职位的层级可能带来高昂的管理成本,在产品团队规模较少,低于100人时,不要启动明确的职级划分。