专访POWER8编程挑战赛选手黄文超:非专科生的编程算法之路

正如大赛发布仪式上,IBM大中华区副总裁侯淼所言,之所以要支持这样一个大赛,目的就是希望吸引更多的开发者去开发一些新的算法,把整个POWER8引擎的能力激活开来。

“UCanUUp”是这次挑战赛的口号,开发者可以通过登陆注册、申请资源、完成挑战,主办方最终根据各自的累积评分赢取礼品奖励。在比赛期间,主办方将定期公布挑战题目,采用月度赛制对参赛者进行排名评定。

到目前为止,已经有数百名开发者报名并参加了此次大赛,为了让更多的开发者了解此次大赛的进展情况,日前,我们专访了其中一位参赛选手逸云计算机科技有限公司CEO/总裁黄文超,希望通过他的参赛经历,吸引更多的技术达人参与到大赛之中。

以下为采访内容:

黄文超:大学阶段:我是2009年于郑州大学电子科学与技术系毕业的,在校期间参加过数学建模竞赛(2007全国一等奖)、ACM/ICPC(2008合肥赛区铜奖)。

因为本身不是计算机专业,所以在大学里面除了算法、数据结构方面,对计算机语言仅限于初步的C/C++和MATLAB使用。

工作阶段:2009年毕业后进入银行工作,主要用.NET系列技术进行一些内部系统的开发。在银行进行一些编程以外的技术工作,包括网络管理、服务器维护等。

2012年开始自学转型使用PHP,同样完成一些银行内部系统的开发。主要的项目包括独立完成的《绩效考核系统》、《自动化审批系统》等。

此后在工作期间接收一些企业网站开发之类的项目,基本上用WordPress实现,熟悉通过深度定制WordPress(模板、插件)进行网站建设。目前为止通过WordPress建设并维护的网站超过10个。

创业阶段:2014年开始自己创业,技术转型Python,主要使用Django框架进行开发,对前端、HTML5等技术有初步的理解和实践经验,并了解掌握基本的Linux服务器环境部署。

2.区分垃圾ID数据和正常ID数据的核心关键是什么?可否借此展开描述一下所设计算法的基本思路?

黄文超:现在判断垃圾数据主要有三种类型:

3.这一算法设计思路,主要用到了什么计算模型?有没有独特的创新亮点?

黄文超:主要用到的计算模型包括“中文分词技术”、“词频-逆文本频率指数(TF-IDF)”和“余弦定理文本分类方法”。

主要参考Google吴军博士的《数学之美》里面介绍的算法,并参考了一些GoogleScholar上面找到的关于splog的论文里面对垃圾博客特征的一些描述。

5.基于这一思路的算法设计,能否充分发挥IBMPOWER8的并发计算优势?信心来自于哪里?

黄文超:由于主要耗时的算法环节是互相独立的(网页解析、分词、向量夹角计算),完全可以进行多进程计算,从而充分利用IBMPOWER8的性能优势。

黄文超:此前对POWER8架构并没有过多深入了解,但自这次比赛最初接触以来,它在计算性能方面还是有独到的优势,因此对于我的工作本身来说,希望POWER8平台能在更多的云平台服务上提供服务,让我们这类Web开发者有更好的选择。

7.对于多线程及并发编程技术的发展,你怎么看?你认为还有哪些可以改进的方面?

黄文超:这当然是大势所趋,因为从主频上面感觉其实没有多大的空间可以挖掘了,为了提升计算的性能,唯有通过并行计算、分布式算法实现,而且近年兴起的大数据技术浪潮,也从另一方面支持了这一方向。在往后的计算机应用发展中,并行算法、分布式计算会变成主流中的主流。

8.参加这次算法挑战赛的感受如何?对这一活动有什么好的建议?

黄文超:CSDN和IBM的同事都很认真负责,耐心解答各种问题以及解决部署中产生的各种问题。

随着比赛的进行,原本一些不太完善的必要环节也逐步得到完善。非常感谢CSDN和IBM提供这个平台。

THE END
1.赛氪赛氪竞赛网是高含金量竞赛平台。为全国大学生提供各类高含金量竞赛信息聚合、报名和成绩查询服务,提供适合大学生参加的英语竞赛、数学竞赛、编程挑战赛、知识竞赛等比赛信息,涵盖全国大学生英语竞赛、蓝桥杯、互联网+大学生创新创业大赛等知名竞赛报名及成绩查询;https://www.saikr.com/vse/41662
2.算法竞赛入门指南acwing风评团体程序设计天梯赛基本模拟,暴力,阅读理解。国三不难,爆的米也不少。 百度之星今年打了一场,4题,省二中游。手速4题可以省一,难度大概介于蓝桥杯和xcpc之间。题目质量还是可以的,但对算法基础要求比较高,比如二分最大化最小值,字符串哈希这些你得会。 https://blog.csdn.net/2301_79199219/article/details/139033431
3.CCF算法能力大赛CCF官网 站点地图 常见问题 报名参赛加入CCF 竞赛资料 【CACC】关于区域赛成绩查询及复议的通知 4536 2027-12-17 万人同场,算法竞技,首届CCF算法能力大赛昨日开赛 10545 2024-12-03 【CACC】赛前必读!!! 9654 2024-11-29 【CACC】关于区域赛准考证下载的通知 https://cacc.ccf.org.cn/
4.ACM金牌学长,算法竞赛经验分享51CTO博客也许你可能不参加算法竞赛,但知道厉害的人如何学习、训练、一步步变强,也是可以借鉴和学习的。 如果有一天你根据这个指南训练,拿了大厂offer、ACM奖牌,记得和小熊来说一声,哈哈。 文章目录如下,将从以下八个方面展开,接下来进入正文。 一、ACM竞赛 ACM程序设计竞赛是三人组队赛,一场比赛5个小时,通常有10~13个问题https://blog.51cto.com/godweiyang/5516880
5.2022世界机器人大赛—青少年机器人设计大赛Super AI超级轨迹赛项是一项集趣味性和挑战性为一体的赛事,着力培养学生的工程设计、逻辑思维以及临场应变等综合能力,并同时锻炼提升参赛选手的大局观意识以及策略性思维能力。 本赛项2022年竞赛主题为“星际家园”。在比赛中,要求参赛学生在规定的时间内,根据现场公布的路线和任务,对机器人的设计和制作,来完成“星际https://www.worldrobotconference.com/cn/view/1654.html
6.2023年师生信息素养提升实践活动省级现场选拔赛(算法设计和贵州省 2023 年师生信息素养提升实践活动 省级现场选拔赛(算法设计和科创实践项目) 参赛指南 主办单位:贵州省电化教育馆 承办单位:贵州师范学院 贵州振华信息技术有限公司 选拔赛时间:2023 年 7 月 7 日-7 月 8 日 选拔赛地点:贵州师范学院 -1- 目录 代表须知 - 3 - 日程表 - 5 - 线路图 http://www.jzjyyun.cn/ft/cms-ft/download?fid=1397894566917570560
7.教育部认可的大学生学科竞赛网站链接(2023版)“挑战杯”分为学术科技作品竞赛和创业计划大赛,每个比赛两年举行一次。 http://www.tiaozhanbei.net/ 3、“挑 战杯”中国大学生创业计划大赛 http://www.tiaozhanbei.net/ 04.ACM-ICPC国际大学生程序设计竞赛 (暂无官网,大家可咨询学校老师) 05.全国大学生数学建模竞赛 http://emlab.usst.edu.cn/_t239/2024/0328/c5351a317466/page.htm
8.牛客竞赛OJACM/NOI/CSP/CCPC/ICPC牛客竞赛是专业的编程算法训练平台,包括ACM校赛、ICPC、CCPC、CSP、信息学奥赛、NOI等编程比赛提高训练营。适合初级小白编程入门训练,包含CSP入门级提高级赛前集训、ACM区域赛前多校训练营。https://ac.nowcoder.com/
9.关于举办“第七届全国大学生现代通信网络部署与优化设计大赛”的本赛道竞赛内容基于智慧城域网工程实践,要求选手在竞赛平台中完成智慧城域网的网络规划、施工、配置、调测、维护、优化等任务。主要考察选手对全光网络端到端的网络规划、设计、部署、运维管理等方面的综合实践能力。 (三)通信大数据智能运维算法设计赛 本赛道围绕通信大数据智能运维及人工算法智能分析方向,要求选手在统https://www.china-cic.cn/Detail/24/67/4725
10.智能体大赛投票开启!一键查看智能体大赛决赛作品按照智能体名称首字母排序。 注:请勿在体验智能体时切换窗口,可能会导致体验不佳哦~ 818图表生成器 818图片生成小助手,一键打造专属图表!轻松编辑,快速输出,让你的思维导图/流程图/时序图/关系图瞬间脱颖而出,精彩生活由此开启! 点击图片快速体验智https://mp.weixin.qq.com/s?__biz=MjM5NTg4OTgwMg==&mid=2652481468&idx=1&sn=f6305a59eecbf0d718c2a65b33fe28bc&chksm=bcdcfb94e93305d7f0ce0c5ec76310423a0bdee14d8189005db74b6e938a131618d3889430ec&scene=27