微软大中华区专家交流纪要

内容纲要
Keynote:
微软 23 年策略:  all-in GPT;砍掉了一些产品线,比如 VIVA、工业元宇宙与数字孪生团队解散;
关于 4 月 18 号的国内Teams 发布会:与 Copilot 的推出没有必然联系,  22 年 11 月就规划好了  (去年没发布是因为 国内数据中心没落定),有无 copilot 功能不确定,  copilot 这个功能 22 年就已测试成熟。
MS Office 整合 GPT 以后的 ARPU 值展望:  ToC 端预计不会有 ARPU 值增长;  目前给企业级合作伙伴 24 年的报价单   也没提价;大中华区主要客户为 C 端与 SMB ,C 端 copilot 是比较通用化/标准化的 feature,不需要基于用户数据做特别训练,端侧算力就能满足需求,且微软在国内的数据中心能满足轻量化模型部署需求;  SMB 与大 B 关注运营效率, 模型的定制化/调优属于增长服务,但不会通过提高年费方式实现收入,而是根据客户需求为功能的使用付费(流量/模型调用次数等) 。
大中华区策略:  短期侧重提高市占与渗透率,促进正版化提升 ,拉升用户留存与使用时间,  目前没有涨价的诉求。
数据监管面临的问题:
(1) 数据安全:用户隐私数据/访问权限问题可以通过技术手段短期解决;
(2) 合规/数据出境问题: 得看当地的监管政策,  目前是灰色地带;  
(3) ESG 与伦理问题:滞后与前两个问题解决;
跟意大利的沟通/GPT 封禁亚洲账号:大概率通过罚款形式解决;  封禁账号与意大利、三星、中美关系都没必然联系; 主要是保障用户行为合规,  在监管方面微软目前较谨慎;
GPT 在大陆可用性问题:  短期在大陆开放使用的可用性不高。  原因有三:  ‘
(1)  算力/存储问题:  国内数据中心资源不够, 考虑到中国区收入与经济回报比,  未来 3-5 年在国内大规模建设数据中心本地化训练的可能性不大;
(2)  数据出境:  大模型训练在美国,涉及数据出境问题;
(3)  需要遵守美国的法规:尖端技术不可能立刻引进中国,比较典型的例子是   Teams,国内有一堆竞品才决定来中国,  怕被国内友商 copy,需要保持技术先进性;
国内企业出海/海外企业进入国内的 GPT 使用问题:  看数据中心所在地,  GPT 可以私有化部署。国内企业出海数据中 心在海外可用;  海外企业进入国内,数据中心在国内也可用;

国内 AI 芯片好坏:寒武纪 MLU370 买得多,  A100 的 60-70%;寒武纪服务态度与体系好;对接效率高;断货风险小; 壁仞宣传做得好,但实测的卡不太拿得到,量产能力可能不够。海光量也够、参数也不错,技术与供货角度都比较好   但海光在美国黑名单里面,有出海生意的厂商不敢用 ,容易被连坐。

Q&A:

Q:OpenAI 为什么 17 年转向 PyTorch 框架?

A:API 迭代稳定性比 Tensorflow 好,开发者调用/使用 GPT 的门槛更低。

Q:GPT4.0 的参数规模? GPT5.0 什么时候推出?

A:万亿水平。  GPT5.0 已经训练完成,具体推出的时间点网上查到是啥就是啥(网上传的是 23 年底)。  GPT5.0 的参数 规模未知,得到 PR 文出来。目前大中华区 AI 实验室模型的参数调整已经暂停,什么时候重启不确定。

Q:GPT5.0 较之 4.0 主要提升的地方还是多模态的能力?

A:除了多模态能力提升外,还有一些垂直应用场景的延伸&跟 partner 在应用场景的整合与细化。官方的 GPT5.0 信 息在  PR 没出来之前没有准确的数。ChatGPT 出来之前已经在做一些垂直场景的应用功能,  比如语音生成文本、虚拟 现实中的语音、文本生成、视觉交互、低代码开发等之前都有相关解决方案。

今年微软商业战略有些调整:把几条产品线取消,  比如微软 Viva  (企业内部的  CRM、员工管理、知识库管理)、 hololens 事业部(商用混合现实技术产品线)中的 AR/VR/MR 原来是有针对工业元宇宙、数字孪生等场景有整合的解 决方案,  去年年底把工业元宇宙与数字孪生团队取消,  23 年 all-in GPT。

微软有 3 朵云:Azure 云服务(目前 GPT 部署在上面)、  GPT 将拓展到另外两朵云:  办公全家桶(MS 365、Teams、VIVA 等)、  Bussiness Application  (PowerBI 等产品)  都会整合 GPT 能力。

Q:4 月 18 号世纪互联推广 Teams 与 MS 365?

A:Teams 登陆中国去年 8 月就已经规划了,跟 Copilot 的发布没有必然联系。

Q:要发布的 Teams 国内版没有集成 Copilot 能力?

A:这次会议的主题是“强 AI 时代的组织效能升级”,Teams 与 MS 365 套件本身就有些 AI 功能,  copliot 是在原有 AI 能力基础上加持 GPT 能力,比如语音文本生成、格式/内容生成等。这些都在 Roadmap 上,去年 11 月已经在做战 略规划与小范围测试了。4 月 18 号这个节点与 Copilot 没有必然关系,去年就规划了这件事。

Q:4 月 18 号不会有 copilot 插件?

A:不是因为 copilot 开的会,但这个功能什么时候发布不知道。开这个会是我们去年已经确定的“Win back”战略,   国内过去盗版昌盛、市占率也低,  也催着世纪互联来加速推这个事,  去年没发布是因为世纪互联在国内的数据中心建   设不够完备,微软在国内的北三数据中心落地后存储与算力上来了,  今年才要回到中国。总部本来也是不 care 的,但   大中华区有收入增长的诉求。  Copilot 这个 feature 去年已经测试的比较成熟了,18 号有发布可能,feature 全部ready。

Q:MS 365 之类的产品集成 copilot 能力后,  短/中/长期 ARPU 的展望?

A:定价属于微软产品策略,由微软总部来定。中国产品价格也是总部设定。微软收入大头是 Modern Work Solution (全家桶)。报价模式:云计算服务是按流量付费,云计算服务截止今天没看到提价倾向。
Copliot 集成的 MS 365 后我不认为会有 ARPU 值增长,包括我们企业级的合作伙伴,在做报价单的时候目前明年价格 也没有明显变化。我们目前大中华区的策略是“Market Winback”,在国内我们市占不是很高,核心目标是拉升用户 留存与使用时间,单价目前没有涨价的诉求。ARPU 概念来自于电信运营商,  比如你用了 4G、5G 套餐,标准是 50 块 钱,但最后你的账单远高于 50 快,因为你的使用超出了套餐范围。云计算是一样的道理,  我们不是通过 ARPU 提升来 抬客单价,MS 365 与 Dynamic 365 我们的策略是维持当前 ARPU 的情况下,推出些增值的 feature 让客户买单。  C 端用户用通用的功能就能有较好的体验,我们训练好的模型通过插件/微服务的方式推给 C 端客户就行,比如网上传得 比较多的给 copliot 个大纲,生成个 PPT,这是比较通用的微服务。对于 B 端用户,模型要调优、要训练,训练过程中 就需要有增值服务,比如现在按 tokens 收费的方式,客户用量越大价格可能越高。中国区目前的策略是追求市占提升 与渗透率,针对的客户主要为中小型企业与 C 端客户,这些客户还是在力争开账户的阶段,体量还不大,能训练的数
据量没那么大。这方面担心两个问题:  1)中国区算力不够;2)监管问题,可能牵扯数据安全;
总结:  我们涨不涨价跟 C 端用户关系不大,  C 端用的是标准化的产品与 feature、通用化的微服务;  对于 SMB 与 To 大 B 客户,  他们最关心的是 Opex,虽然有新增付费的功能点,但 B 端客户整体运营成本是降低的,  比如设计费用、人工 费用都会节省,对于微软是增收,  对于客户也有好处,但也不是通过直接提高产品年费的形式实现,而是客户根据需 求为新功能的使用付费。大企业的 IT 团队很强,  诉求也差异化,我们也只需要把 API 开放给他们,  定制调优他们自己 做,  API 调用收 license/流量费这个我们会去做。
海外跟大中华区又不一样,海外我们的 SAAS/微服务比较好卖,  海外客户希望开箱即用。

海内外的策略规划与战略执行的思路类似,  只是中国区短期侧重市占与正版化多些。

Q:关于数据安全的问题,目前我们跟大陆监管机构如何沟通的?

A:没有直接沟通。有关安全与合规问题,我们在中国的策略落地较之海外有时延,主因:  1)市场规范化程度;  2)地 缘政治/中美关系问题;合规问题目前还游走在灰色地带。

Q:目前我们面临哪些数据监管的问题?

A:三个问题:  1)数据安全:用户隐私数据/数据访问权限问题;这是技术层面能解决的问题,比如通过网络访问节点 的权限控制能进行规范化,这是微软安全技术/合规体系比较成熟的部分,也已经融入三朵云的底座中去了,比如端点/OS/网络控制,我们只要进一步对数据访问进行规范化,  这个问题就能解决。我们已经做过实验,在 linux 服务器上, 针对 GPT 模型进行针对数据访问的微调,  GPT 在用户访问时能反映某些问题涉及的数据是没有经过授权的,  GPT 会终 止操作。  2)合规/数据出境问题:  不止是微软的问题,阿里、腾讯也有这个问题,全球也没有特别好的监管方法;  3)  ESG 与伦理问题:系统性因素,需要技术与宏观监管体系都比较成熟后能克服。好的点是很多类似的问题以前也遇到 过,比如 4G、5G 普及过程中也有很多问题,后续都陆续解决。现在可以明确的是数据安全涉及的技术问题我们能很 快解决,  监管要求的变化需要等待与跟随。

Q:跟意大利目前是怎么沟通?

A:现在还在沟通中,意大利其实算特例。全球范围内大型互联网企业 CEO 在当地被判刑的只有意大利,意大利对新 技术引进比较左派/排外。  当年也解决过很多 GDPR  (一般资料保护规范)涉及的合规问题。归根到底这种问题的解决 最终就是罚款,  Google 当年也面临过数据安全与反垄断的罚款,这个问题最终会解决。

Q:亚洲地区 GPT 账号出现大面积封禁的原因?

A:有几件事是一起发生的:  1)  我们现在在查 1 人多账号、用户行为合规的问题;  2)  意大利、三星反馈 GPT 有数据 安全隐患;这些问题有些关联,我们规范账号与行为合规也是为了解决安全隐患,我们走在行业最前端,很多监管问 题最先遇到,从微软过往的运营角度来说,都是比较保守的,  在用户合规与监管方面我们暂时是比较保守的,通过安全审查后,账号访问权限还会放开。

关于 GPT 在大陆的可用性问题:一段时间内在大陆可用的可能性不高 ,两个原因:  1)算力/存储问题:在国内的数据 中心资源还不够;2)监管问题:  GPT 模型目前不是在中国训练,涉及数据出境问题;还是可以翻墙出去用,但单个 IP 能有几个账号、整个收费模式如何还得看,当前以应对合规审查为第一优先级。(商业模式:  funing-model:免费使 用,为流量/特定功能调用付费;  Subscrption-model:订阅)。

Q:如果我们数据中心能满足几千上万 PD 的算力需求,可不可以在国内训练不出境,还会有监管问题?

A:理论上可行。但我们在国内是要看收入与经济回报性价比的,这些投入在国内如果收不回成本就不值当。从中国区 对微软的收入贡献来看,未来 3-5 年在中国训练大模型的可能性不是很高。除了经济回报的问题,我们也遵从美国方 面的法规要求,  最先进的技术不能在大陆应用,就像 Teams ,国内出了这么多竞品后,  Teams 才登陆中国,  就是因为 最先进的技术不能立刻来到国内。中国市场变化也特别快,有顶尖研发人才&相对便宜的工程师,我们的先进技术如果 马上带到大陆,被 copy 的可能性很大,不能保持技术先进性。腾讯与字节跳动都是微软头部客户,我们采用的是竞合 策略,我们希望在比较长的时间跨度能把优势技术赋能给他们,  而不是很短的时间就被他们学会我们的核心竞争力。

Q:如果说我们不能在国内训练模型,要应用 GPT 的话数据出海不可避免,  怎么赢回市场?

A:ToB/ToC 是两个策略。“Win-back”是针对 ToC/SMB,用得多是通用功能,copilot 也不需要特别多定制化训练, 通过 API/微服务开放通用模型就可以。

Q:copilot 不需要针对国内用户数据训练?

A:C/B 端客户用 Copilot 不涉及大规模数据训练,大 B 客户要定制化训练要上云。  Copilot 本质是订阅制产品的一个 功能,是我们“Win-back  “市场的一个工具。

Q:copilot 通过目前啊流通的通识知识训练已经很成熟,不需要来自用户的增量数据?

A:其实现在的 office 365 已经有很多 AI 功能,比如一键换肤/生成模版等等,copilot 只是进一步提高自动化水平, 你可以把这些 AI 功能全部集成,  通过对话式的方式快速实现,  文生图、语音生文本这些功能原来都不是集成 copilot 里的,而是要用到工业元宇宙等场景。  而且即使 copilot 需要做些推理,也不需要在 Azure 上专门推理,算力需求不 大,结构化的图片/文本不太占用太多算力,端侧可能就能满足算力需求。而且我们在世纪互联的数据中心上也部署了 轻量级的大模型(中模型)。

Q:我们内部觉得 ToC 这种模式不会涉及数据合规?

A:不太会。

Q:国内企业出海/海外企业进国内的 GPT 使用问题?

A:微软的合规体系在世界范围内都是最健全的,微软这套体系被安全审查的概率较小。我们反黑客/安全风险的能力   也是很强的。技术、架构体系、信誉都比较好。中国厂商出海会有美国贸易部门的黑名单问题,比如如果国内公司出   海,海外子公司不可能用华为云,  华为在黑名单里,再者有些芯片厂商可能也在黑名单里,那用这些芯片的服务器也   没法出海。国内企业出海直接用微软云与骨干传输网络就好,比如腾讯,是微软在大陆最大的游戏客户,腾讯在中东   没有数据中心与传输网络,在中东的生意是基于微软基础设施起步。腾讯后来做了自己的数据中心,他们的反攻击、   反入侵、社区运营等等很多东西是跟微软很类似的。做 ToB 大客户会涉及到利益交换。国内企业出海肯定可以用 GPT。 在华的外企方面,比如欧莱雅、一汽大众我们在谈 GPT 的使用。

Q:欧莱雅为什么能用?

A:数据中心在中国,可以私有化部署。比如星巴克中国的数据中心在国内。

Q:国内厂商的算力储备?

A:国内算力储备最多的是阿里(阿里云 A100 上万片左右;整个集团是 A100 阿里云 5 倍左右;  外部算力+集团+阿 里云差不多能到 10 万片算力  (1万片阿里云,其他 A100 是各业务线);  阿里今年 A100 有 30%+增速 ,8-9 个大客户 有大模型训练需求;已经在下单了,今年到明年初阿里集团能达到 10 万片量级);  大模型最好的是文心一言(Bert 体 系,年初 3000 台 A800 8 卡服务器;全年5 万张);  国内看好百度、字节,有算力、算法/模型团队、聚合数据能力强。

给TA打赏
共{{data.count}}人
人已打赏
程序员

“ChatGPT们”的淘金时代

2023-4-4 17:55:37

程序员

GPT将带来一场中产危机?8成劳动人口受影响,学历收入越高越危险

2023-4-10 20:27:30

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索