一点资讯总编辑吴晨光“对话”2000万自媒体人：揭秘内容分发的最新逻辑新闻频道|什么叫算法模型_在线学习

这个故事，讲述的是“我”是如何在老板的眼皮底下看日本AV动作片的。

图说：有谁认识这位同学，请举手！

核心的问题来了——为什么只要摄像头拍到他，我的屏幕就能变化？因为我做了一套人脸识别系统。我用尽一切手段（包括上百度搜索、贿赂他的秘书等等），收集了老板10万张照片，然后输入到我的计算机里，计算机对这些照片进行学习（学习又分为有监督学习、无监督学习、半监督学习、深度学习等等，总之就是拼命学），于是可以判断出摄像头拍到的照片和我输入的照片的相似性。一旦相似度达到一定的数值，就认定是老板走过来了。于是就给屏幕下达指令，迅速从AV切换到研究算法分发的页面。

这就叫人工智能（AI）。人工智能是最大的概念。而向计算机里输入照片，学习辨别此人是不是老板的过程，就是机器学习。人工智能有很多应用，比如这个小故事里讲的叫“人脸识别”，此外还包括无人驾驶、健康诊断，著名的阿尔法狗则是人工智能在围棋领域的应用。在一点资讯的应用，就是通过算法分发信息，实现千人千面、私人定制。

全球最伟大的人工智能公司是谷歌。他们有一个机构叫“谷歌大脑”，主要研究人工智能的应用；中国的百度公司也在向人工智能公司进发，他们通过搜索积累了大量的数据，这就如同上一个小故事里讲的搜集照片的过程——没有大数据，无法实现人工智能。

用户画像：他是谁？喜欢什么？

先看用户画像。

如上图展示：在用户画像中，生活环境是基础。生活环境又包括两个层次，第一是地理位置。一点资讯已经能定位到商圈和小区，而百度地图、滴滴打车已经能实时定位到你站的地方。衣食住行、水电煤气，包括政府提供的产品服务，都和你的生活环境、地理位置有关系，所以，地理位置越精准越好。

第二个层次是手机环境。它同样包含两个含义，一是手机型号，不同型号的手机使用者的阅读习惯是不一样的，比如红米用户和苹果用户。即使是同一个品牌的手机——OPPOA57和OPPOR11，使用者的阅读习惯也是不相同的，这都需要我们通过数据去洞察。另外，我们的手机里激活了哪些软件，使用的频率如何，在不影响用户隐私的情况下，都需要去深刻洞察。

第三个层次是用户信息。如果你是注册用户，你的性别、年龄、身份、学历等，都可以成为我们判断你兴趣的依据。另外，为了把一个用户画像描述得更精准，一点资讯设计了一个开屏问卷——问用户喜欢什么。有超过50%的用户做了选择，于是，我们能够了解到他们的基本兴趣。当然，也有人不愿意填写，甚至不愿意透露自己的地理位置。所以，这就给我们提出了难题——冷启动时，应该给用户提供哪些信息。

当用户阅读完冷启动首屏内容之后，可能会产生五种情况：

这是一个非常复杂的运算过程。比如，有个用户点击了五次“吴晨光”，搜索了一次“邹明”（凤凰网总编辑），如果只给他推一条，应该先推“吴晨光”还是“邹明”？从数量上来说，一定是“吴晨光”更多，但是搜索属于深度行为，他主动去搜索说明对“邹明”很感兴趣，这种情况应该去推谁？

还有，他点了五次“吴晨光”的图文，要不要推一个视频、音频或者问答？或者一个用户很喜欢“吴晨光”，今天突然出了“邹明”的绯闻，是应该把“邹明”的热点推出来，还是，依然根据用户的兴趣继续推“吴晨光”？

所以，用户画像的复杂性，不是简简单单的群体划分问题。它是对人性的深刻洞察，一个行为，比如点击，背后的含义也完全不同，有的是因为真的感兴趣，有的是因为标题党。

体裁——是文字、图片、视频、音频、直播，还是问答，或者类似微博的短内容？

作者——作者其实代表着背后的自媒体号，包括它的级别、知名度、订阅数等；

THE END

一点资讯总编辑吴晨光“对话”2000万自媒体人：揭秘内容分发的最新逻辑新闻频道

大模型推理框架：赋能AI新时代的强大引擎大模型推理框架：赋能AI新时代的强大引擎在当今这个数据驱动的时代，人工智能技术正以惊人的速度改变着我们的生活和工作方式。...

人工智能AI智能体简介：类型优势应用和示算法机器人大模型自然语言处理

机器学习中的概念区分：模型vs算法

什么是多模态算法模型？人工智能

深度学习中，模型网络算法有什么区别?Worktile社区

大数据分析建模思路技巧和算法的特征

一点资讯总编辑吴晨光“对话”2000万自媒体人：揭秘内容分发的最新逻辑新闻频道

OpenNCCDK丨可编程的AI相机解决方案，让开发嵌入式AI相机不再困难

算法责任：理论证成全景画像与治理范式

科学网—什么是贝叶斯网络？