百家争鸣:2019大数据预测观点数据观中国大数据产业观察

IndustrySpeaks:BigDataPrognosticationsfor2019

数据观|黄玉叶(编译)

“Thefutureisn’twhatitusedtobe”theFrenchpoetPaulValerywroteninedecadesago.Thesamecouldbesaidforthebigdatatrendthatbeganinthemid’00s.We’renotwheremanythoughtwe’dbe,butthefuture,inmanyways,turnedouttobemoreinterestingthanmanyimagined.

90年前,法国诗人保罗·瓦勒里(PaulValery)曾写道:“明日非同往昔。”对于始于20世纪中期的大数据趋势来说,这句话同样适用。如今的我们并不像多数人曾经设想的那样,但在很多方面,未来要比现在许多人想象的更有趣。

Now,aswekickstarttheNewYear,it’sagoodtimetodustofftheoldcrystalball.Datanamihasopenedthefloortoindustryprognosticatorsfromacrossthebigdata,analytics,andITindustries.Let’shearwhattheyhavetosay.

随着新年开启,我们迈向了新的征程,这是个推陈出新的最佳时机。Datanami特此为来自大数据、分析以及IT行业的预言家们提供了畅所欲言的平台,让我们来听听他们有何高见吧。

AccordingtoAshishThusoo,thefounderandCEOofbigdataasaservicefirmQubole,there’snoquestionthatinvestmentsinbusinessintelligenceanddataanalyticssolutionswillcontinuetorisein2019.

Qubole大数据服务公司创始人兼首席执行官AshishThusoo表示:“毫无疑问,商业智能和数据分析解决方案的投资将在2019年持续增长。”

【数据观注释】:Qubole,创立于2012年,是一家基于云端提供大数据DaaS服务的大数据开发公司。Qubole基于真正的自动扩展Hadoop集群,从而使客户能够在云端整合分析大数据。

“Theinterestingquestion,”hewrites,“iswherewillthefocusbe.Iexpecttoseeanuptickinstreamingdataanalytics,asbusinessestrytoleveragereal-timeinformationtomakesmartdecisionsinareaslikecustomersupport,marketing,frauddetectionandupsellingcustomers.”Alsoseeinggrowthwillbeadhocanalyticsasthe“democratizationofdata”continuesitsrelentlessmarch.

“有趣的是,焦点在哪里还不得而知。我预计,随着企业利用实时信息在客服、营销、欺诈检测和推销等领域做出智能决策的尝试越来越多,流媒体数据分析将出现增长。随着“数据民主化”的持续推进,数据分析也将出现增长。

2018was“theyearofthedatacatalog,”declaredAlation.Thattrendshowsnosignoflettingup,asorganizationscontinuewiththeongoingstruggletoinventorytheirdataassetsforthepurposesofmonetizationandregulatorycompliance.As2019beginsinearnest,keeproominyourcatalogforaparticulartypeofdata:behavioralmetadata.

“2018年是数据编录之年”Alation公司宣称,编录数据这一趋势没有减弱的迹象,因为各家集团仍在努力盘存其数据资产,以便实现数据货币化和执行标准。随着2019年正式开始,请在您的目录中为特定类型的数据——行为元数据留出空间。

【数据观注释】:Alation,创立于2012年,是一家企业数据编录服务提供商。他们提供了允许企业利用软件为其数据提供单一访问通道的软件,帮助企业数据库建立索引、商业智能工具以及文件系统,以简化数据搜索,也会自动爬取,解析和索引所有数据和数据的使用日志。

“Analysisofthisdatacanbeminedtobettershineaspotlightonwhat’susedandwhat’suseful,”writesAaronKalb,theVPofdesignandstrategicinitiativesandco-founderofAlation.“ThisisthesameinsightthatdroveGoogleSearch’srankingprowesstwodecadesago:thecontentofawebpagewaslesspredictiveofitsutilitythanhowoftenotherpages—builtbyotherpeople—linkedtoit.AstheML/AIbuzzcontinuestowearthin,we’llseeastrongappetiteemergeforthistypeofimpact-driventechnologyandbehavioralmetadataamongorganizations.”

“这些数据分析可以被挖掘出来,以便人们更好地了解数据使用情况和有用程度,”Alation的联合创始人、设计与战略行动副总裁亚伦·卡尔布(AaronKalb)写道。这与20年前推动谷歌搜索排名的观点是一样的:网页内容对其实用性的预测性较差,不如其他页面(由其他人创建)链接到它的频率高。随着ML/AI(机器学习/人工智能)的热度持续减弱,我们将看到企业对这类影响驱动技术和行为元数据产生浓厚的兴趣。

DespitetheprogressinAIandmachinelearning,westillwon’thaveself-drivingcars,accordingtoLexalyticsCEOJeffCatlin.

Lexalytics的首席执行官杰夫卡特林(JeffCatlin)表示,尽管人工智能和机器学习取得了进展,但我们仍不会拥有自动驾驶汽车。

【数据观注释】Lexalytics,文本分析开发商。其文本分析平台可将数十亿个非结构化数据和在线信息转换为对公司的可行性见解。

“Self-drivingcarsaregettingbetter-0,enoughthatprototypesaretrustedontheroadsinCalifornia,SingaporeandevenWesternAustralia,”Catlinwrites.“Butwhilehumanshavebeenatfaultintheoverwhelmingmajorityofaccidentsinvolvingautonomousvehicles,self-drivingcarsstillhavesomekinkstoironout.From‘seeing’lanemarkersinsnowyconditionstomakingjudgmentcallsaboutwhethertosaveapedestrianoradrivertodetectingkangaroosontheroad,thetechnologystillhasn’tquitefiguredouthowtohandleallofthedecision-makingrequiredwhenyou’reintraffic.”

卡特林写道:“自动驾驶汽车正变得越来越好,好到足以让人们放心乘坐着自动驾驶的雏形汽车行驶在加州、新加坡甚至西澳大利亚的道路上。尽管人类在绝大多数涉及自动驾驶汽车的交通事故中有过错,自动驾驶汽车仍有一些亟待解决的问题——从雪天情况下识别车道标志,到判断是该救行人还是该救司机,再到在路上侦测袋鼠的出出没……这项技术还没有完全智能到可以在交通过程中自行判断需要做出的决定。”

PrivacywillemergeasatoppriorityatthenationallevelaccordingtothefolksatImmuta,aWasingtonD.C.-areacompanythatdevelopssoftwareaimedatboostingprivacyinAI.

隐私问题将成为国家层面的头等大事。华盛顿特区Immuta的工作人员说,该公司开发的软件旨在提高人工智能的隐私。

【数据观注释】Immuta,美国数据服务提供商,成立于2014年。他们致力于为数据管理员提供高效的数据隐私保护和管理服务,值得一提的是,Immuta软件的兼容性非常好,可以部署在任何基础设施上,无论是现场服务器配置,还是在共有云或私有云端应用,甚至两者混搭使用。

“Weexpectprivacytoincreaseinimportanceinthenewyear,highlightingcurrenteffortstocreateasingle,nationalprivacystandardintheU.S.,”thecompanytellsDatanami.“GiventheimpacttheE.U.’sGDPRhashadonhowU.S.andglobalcompaniesoperate,thiswon’tcatchallcompaniesoffguard,butitwillincreasetheimpactsthatprivacyissueshavehad–andwillcontinuetohave–onbusinesses’bottomlines.”

“我们预计隐私问题在新的一年里将变得越来越重要,这突显出美国目前正在努力创建一个统一的国家隐私标准。考虑到欧盟通用数据保护条例(GDPR)对美国和全球公司运营方式的影响,虽然不至于让所有公司措手不及,但会增加现有及或将产生的隐私问题对企业底线的影响。”

Wecouldevenseenewdataprivacyregulationsproposedandenacted,foreseesAdrianMoir,aseniorconsultantinproductmanagementatQuestSoftware.

QuestSoftware的产品管理高级顾问阿德里安莫尔(AdrianMoir)预测,我们甚至可以见证新的数据隐私条例拟议和颁布。

【数据观注释】QuestSoftware,成立于1987年,是业界领先的应用管理解决方案供应商。致力于通过改善企业关键应用的性能和可用性,降低其运行成本,帮助IT专业人员高效率地完成关键业务数据和数据库的管理工作。

“WhetheraffectedbyGDPRornot(mostare),companiesshouldbelookingtoitasaframework,it’sagoodstartingpointforthosebuildingouttheirprocesses,”Moirwrites.“It’simportanttohavesomethingset-upforhowdataiskeptandused.Ifwewanttocontinuetohavepersonalinformationprotected,wewillneedtohavemoreregulation.Nextyear,Ibelievewe’llseemoreregulationproposedand/orputinplace,liketheConsumerDataPrivacyActrecentlyintroducedbyOregonSen.RonWyden.”

Moir写道:“不管是否受到GDPR的影响(尽管大多数都受其影响),企业都应该把它视作一个框架,对于那些构建流程的人来说,这是一个很好的起点。为数据的保存和使用建立适当机制是相当重要的,如果我们想继续保护个人信息,我们需要更多监管。明年,相信我们会看到更多监管提案/或者实施,就像俄勒冈州参议员罗恩·怀登(RonWyden)最近提出的《消费者数据隐私法》(ConsumerDataPrivacyAct)。”

Inlate2018,wewitnessedabacklashagainstcloudvendorsbyopensourcesoftwarevendors.In2019,tensionsbetweenthetwopartieswillcontinuetosimmer,predicts,KarthikRamasamy,thefounderofStreamlioandcreatoroftheopensourceHeronstreaminganalyticsplatformatTwitter.

在2018年底,我们目睹了开源软件供应商对云计算供应商的强烈反对。据Streamlio创始人、Twitter开源流媒体分析平台Heron创始人卡蒂克拉马萨米(KarthikRamasamy)预测,到2019年,这两者之间的紧张关系将继续升温。

【数据观注释】Streamlio,一家美国初创公司,主要业务是提供下一代端到端的实时处理解决方案,致力于打造世界上第一个企业级的端到端实时数据处理平台。

“Thefearhasonlygrownthatbigcloudproviderswillundermineopensourcecommunitiesandvendorsbylaunchingtheirownclosedcloudservicesbasedonopensourcewithoutcontributingbacktothosecommunities,”Ramasamywrites.“However,therearesignsintheserecentmovesthatbigvendorsaretakinganuancedapproach—insomecasesworkingtoco-optopensourcetotheecosystem’sdetrimentwhileinothercasessupportingvibrantopensourceecosystems.Forinstance,therecentlyreleasedAmazonManagedStreamingforKafka(AmazonMSK)islikelytohavenegativerepercussionsfortheApacheKafkaecosystemevenasAmazon’sopensourceFirecrackeraimstoestablishanopensourcecommunityandecosystemaroundit.Thistrendwillacceleratein2019andbeyond,andtheextenttowhichthesecompaniesactas‘goodcitizens’withinopensourcewillbearwatching.”

Amazonhasbeenslowlycreepingintootherventures,includinghealthcare,grocerystores,andnewspapers.Don’tbesurprisedifAmazonmakesabigacquisitionin2019thatimpactshowenterprisesoftwareisdeveloped,saysReidChristianofCRV,aventurecapitalfirm.

亚马逊一直在缓慢进军其他领域,包括医疗保健、食品杂货店和报纸。风险投资公司CRV的里德克里斯蒂安(ReidChristian)表示,如果亚马逊在2019年进行一项影响企业软件开发方式的大型收购,我们也不必感到惊讶。

【数据观注释】CharlesRiverVentures(CRV),成立于1970年,是世界上历史最悠久经营最成功的风险投资公司之一,其投资回报率一直位于风险投资公司前列。

“In2019,IbelieveAmazonwillmakeabigacquisitionthatwillchangetheenterpriseworldandenhanceAmazonWebServices,”Christianwrites.“WithstorageandcomputedecisionstodaymorethaneverinthehandsofdevelopersinsteadofCIOs,IbelieveAWSwillmake>$1BacquisitioncenteredaroundexceptionalDX(developerexperience),meaningworkflowsandUI/UXthatareintuitiveandconsumerlike.IexpectAmazonwillwanttohaveabigenterprisemomentin2019,similartowhatMicrosofthadbyacquiringGitHubin2018.”

克里斯蒂安写道:“我相信到2019年,亚马逊将进行一项足以颠覆业界的重大收购,以增强亚马逊的网络服务。如今,存储和计算决策比以往任何时候都更多地掌握在开发人员手中,而非首席信息官(CIO)。我相信亚马逊将围绕出色的开发人员体验(DX)以超过10亿美元进行收购,这意味着工作流和UI/UX是直观而受消费者欢迎的。我预计亚马逊希望在2019年拥有自己的重大时刻,就像微软在2018年收购GitHub那样。”

There’salotofroomforanalyticstoimpactvariousaspectsofeverydaybusiness,writesDougHillary,astrategicadviserandboardmemberofFractalAnalytics.

Fractalanalytics的战略顾问、董事会成员道格希拉里(DougHillary)表示,(未来)分析有足够的空间去影响日常业务的方方面面。

【数据观注释】FractalAnalytics组建于2000年,致力于为企业(消费品公司、零售商和金融机构)提供理解、预测和培养消费者行为,及改善市场营销、定价、供应链、风险管控和索赔管理的工具。

“EnterpriseswillincreasetheuseofNaturalLanguageProcessing(NLP)andvoiceintegrationwithback-enddata,analyticsandlegacyCRM/ERPsystemstocreatemorepersonalizedandenhancedcustomerserviceforconsumersandemployees,”hewrites.

他写道:“企业将增加使用自然语言处理(NLP)、后端数据语音集成、分析和传统CRM/ERP系统,为消费者和员工创建更加个性化和增强的客户服务。”

Thepushtohybridandmulti-cloudarchitecturesin2018willleadtogreatercloudinteroperabilityin2019,accordingtothefolksinIBMSystems.

IBMSystems的人士表示,2018年对混合云和多云架构的推进将在2019年带来更大的云互操作性。

【数据观注释】IBM,创立于1911年,是全球最大的信息技术和业务解决方案公司,拥有全球雇员30多万人,业务遍及160多个国家和地区。

“Cloudcomputinghasbecomeallbutubiquitous,butrunningacloudenvironmentformanyenterprisesmeansorchestratingaquagmireofservicesandhardwarethatdon’talwaysplaywelltogether,”IBMSystemstellsDatanami.“Withmorethan80%ofenterprisesusingfiveormoredifferentcloudproviders,theabilitytoquicklyandseamlesslymovedatabecomestopofmindforanyITdepartment,particularlyasAIandotherdata-intensiveworkloadsbecomeincreasinglycommon.In2019,expecttoseemoreinnovationsinstoragehardwareandsoftwarethathelpcompaniesreigninandbettermanagetheircloudfootprint.”

IBM方对Datanami表示:“云计算已经变得无处不在,但是为许多企业运行云环境意味着要协调服务和硬件之间的窘境,它们并不能总是很好地协同工作。随着80%以上的企业使用五家或更多不同的云提供商,快速无缝移动数据的能力成为每一个IT部门的首要任务,尤其是在人工智能和其他数据密集型工作负载变得越来越普遍的情况下。预计到2019年,存储硬件和软件将出现更多创新,以帮助企业更好地控制和管理云足迹。”

ExpectdatamanagementandAIdevelopmentinthecloudtobecomemoreautomated,writesAtishGude,chiefstrategyofficeratNetApp.

NetApp首席战略官阿蒂什古德(AtishGude)表示,预计云计算中的数据管理和人工智能开发将变得更加自动化。

【数据观注释】NetApp,创立于1992年,是向目前的数据密集型企业提供统一存储解决方案的居世界最前列的公司,其DataONTAP是全球首屈一指的存储操作系统。

“ArapidlygrowingbodyofAIsoftwareandservicetools–mostlyinthecloud–willmakeAIdevelopmenteasierandeasier,”Gudewrites.“ThiswillenableAIapplicationstodeliverhighperformanceandscalability,bothonandoffpremises,andsupportmultipledataaccessprotocolsandvariednewdataformats.Accordingly,theinfrastructuresupportingAIworkloadswillbealsohavetobefast,resilient,andautomated.WhileAIwillcertainlybecomethenextbattlegroundforinfrastructurevendors,mostdevelopmentwillstartinthecloud.

古德写道:“人工智能软件和服务工具在云计算运用中的快速增长,将使人工智能开发变得越来越容易。人工智能应用程序将提供高性能和可伸缩性,无论是在内部还是外部,并支持多种数据访问协议和不同的新数据格式。因此,支持AI工作负载的基础设施也必须是快速、有弹性和自动化的。虽然人工智能肯定会成为基础设施供应商的下一个战场,但大多数开发都将从云计算开始。”

TomLaRock,a“headgeek”atSolarwinds,hasgoneoutonalimbandalreadydeclaredthat2019willbetheyearofDataOps.

Solarwinds公司的“首席极客”汤姆拉洛克(TomLaRock)冒了个险,宣称2019年将是数据操作年。

【数据观注释】SolarWinds,创立于1999年,总部位于美国德州Austin,是一家IT基础设施管理软件的领先提供商,致力于为企业开发软件以帮助管理其网络,系统和信息技术基础架构。

“Intoday’sincreasinglydigitalworld,datacannotbeexcludedfromtheagiledecision-makingprocess,”LaRockwrites.“Infact,wepredictthat2019willbetheyearthatdataisrecognizedasakeybusinessdriver.Dataculturewillbecomeincreasinglyimplementedintotechenvironments,andorganizationswillbecomedata-drivenanddata-first.ThisshiftwillalsogiverisetoDataOpsastraditionaladminsstarttounderstandthattheirdaysoftuningindexesareending,onepageatatime.”

“在当今日益数字化的世界中,数据不能被排除在敏捷决策过程之外,”拉洛克写道。“事实上,我们预测2019年将是数据被认为是关键业务驱动因素的一年。数据文化将越来越多地应用到技术环境中,企业将成为数据驱动和数据优先。这种转变也会带来数据操作,因为传统的管理员开始意识到,他们一次只能调一个页面的优化索引的日子即将结束。”

It’sbeenalongtimecoming,but2019willfinallybetheyearthatAIgoesmainstream,accordingtoZacharyJarvinen,headoftechnologystrategyforAIandanalyticsatOpenText.

OpenText人工智能和分析技术战略主管扎卡里贾维宁(ZacharyJarvinen)表示,这将是一个漫长的过程,但2019年终将会是人工智能成为主流的一年。

【数据观注释】OpenTextCorp,创立于1991年,加拿大最大软件公司之一,也是全球知名的企业内容管理公司,专门研发企业使用的产品帮助管理大量内容。OpenText提供的软件应用程序可为大型企业,政府机构和专业服务公司管理内容和非结构化数据。

“Thelong-promisedenterpriseAItransformationispoisedtobegininearnestin2019,”hewrites.“Mostenterpriseshavereachedapointofdigitalmaturity,ensuringaccesstoqualitydataatscale.Withmaturedatasets,AIproviderscanofferlowercost,easiertouseAItoolsforspecificbusinessusecases.”

他写道:“由来已久的企业人工智能转型之约将于2019年正式启动。大多数企业已经达到了数字化成熟度,确保了大规模获取高质量数据的能力。有了成熟的数据集,人工智能供应商可以为特定的业务用例提供更低成本、更易使用的人工智能工具。”

Thelanguagesyouusetobuildapplicationsintheemergingserverlessparadigmmaynotbethelanguagesyouusenow,accordingtoAmodGupta,directorofproductmanagementforAppDynamics.

AppDynamics产品管理总监阿莫德古普塔(AmodGupta)表示,在新兴的无服务器范式中,用于构建应用程序的语言可能不是现在使用的语言。

【数据观注释】AppDynamics,成立于2008年,总部位于旧金山,是一家应用性能管理公司,曾连续三年保持Gatner应用性能管理产品领导者地位。

“Javaand.NETwillbeoverthrownasthede-factolanguagesforserverlesstechnologies,”Guptapredicts.“WewillseemoreandmoreenterprisesadoptnewlanguageslikeNode.jsandPythonforbuildingonnewtechnologieslikeserverless.Sofar,Javaand.NETruledtheroostinenterprises,butthefootprintofthenewlanguageswillincreasebyalot.Serverlessfunctions,likeLambdafunctions,havesofarbeenpredominantlyusedindevelopmentandpre-productionenvironments,butwe’llseethemmovetoproductionworkloadsthisyear,especiallyasNode.jsandPythoncatchoninbroaderadoption.”

Gupta预言:“Java和.NET(MicrosoftXMLWebservices平台)将被颠覆,成为无服务器技术的事实语言。我们将看到越来越多的企业采用像Node这样的新语言。用于在新技术(如无服务器)上构建的Node.js和Python。到目前为止,Java和.NET企业占据着主导地位,但新语言的足迹将增加很多。无服务器功能,像Lambda函数,到目前为止主要用于开发和预生产环境,但我们可以看到他们今年转向生产工作负载,尤其是Node.js和Python得到了更广泛的采用。”

Bigdatameansbigstoragerequirements,evenforsmallcompaniesin2019,accordingtoDouglasBrockett,presidentofStorageCraft.

StorageCraft总裁道格拉斯布罗克特(DouglasBrockett)表示,大数据意味着巨大的存储需求,即使对于小公司来说,在2019年也是如此。

“Petabyte-sizedatamanagementusedtobeachallengeonlylargeenterpriseswouldface,”Brocketwrites.“Withdatagrowingten-fold–accordingtoIDC–thepetabyteerawillstartbarrelingdownonmid-sizedorganizationstoo.WhatusedtobeananomalywillstarttobecomethenormforSMBsandmid-sizeorganizations.Mid-sizedorganizationsinparticularwillfindtheirITarchitecturessimplycan’tscalewiththeirdatagrowth.Unlikelargeenterprises,theywon’thavetheskillsorbudgettocopeeither.Thedemandtobringdatamanagement,protectionandcost-effectivescaleoutstorageintoasinglefrictionlessenvironmentwillrise.”

“Pb级的数据管理曾经只是大企业才会面临的挑战,”Brocket写道,“根据国际数据公司IDC的数据,随着数据增长10倍,Pb时代也将开始对中型企业造成冲击。过去反常的情况将开始成为中小型企业和中型集团的常态。特别是中等规模的企业会发现,他们的IT架构根本无法随着数据增长进行伸缩。与大型企业不同的是,他们既没有技能也没有预算来应对。将数据管理、保护和成本效益高的大规模存储引入单一无阻环境的需求将会上升。”

We’llfinallystarttoseeAIimpactinghealthcare,writesGianfrancoLanci,presidentandCOOofLenovo.

联想(Lenovo)总裁兼首席运营官吉安弗兰科兰奇(GianfrancoLanci)写道:我们终将看到人工智能对医疗保健的影响。

“AIisreducingemergencywaitingroomtimes,enablingremotepersonalizedhealthcaredeliveryandmonitoring,offeringtheavailabilityandaccessibilityofcriticalhardwareandevenfreeingupdoctors’timebydetectinganddiagnosingtumors,”Lanciwrites.“Theseadvancementsareliterallysavinglives.”

You’veheardofAI.But2019willseetheriseofEI,orethicalintelligence,accordingtoChristianBeedgen,theco-founderandCTOofSumoLogic.

你听说过AI(人工智能),但2019年将出现EI(伦理智能)的崛起。SumoLogic联合创始人兼首席技术官克里斯蒂安比德根(ChristianBeedgen)表示。

“Ourfascinationwiththeuseofcomputingpowertoaugmenthumandecision-makinghaslikelyoutgrowneventhetremendousadvancesmadeinalgorithmicapproaches,”Beedgenwrites.“Inreality,thesuccessfuluseofAIandrelatedtechniquesisstilllimitedtoareasaroundimagerecognitionandnaturallanguageunderstanding,whereinput/outputscenarioscanbereasonablyconstructed,andthatwillnotchangedrasticallyin2019.

“Theideathatanybusinesscan‘turnonAI’tobecomesuccessfulormoresuccessfulispreposterous,nomatterhowmuchdataisbeingcollected,”hecontinues.“Butthecollectionofdatatosupporthumansandalgorithmscontinuesandraisesimportantethicalquestionsandissomethingweneedtopaycloseattentiontooverthenextfewyears.Dataishumanandthereforeisjustasmessyashumans.Datadoesnotcreateobjectivity.Itiswellestablishedthatdataandalgorithmsperpetuateexistingbiasesandautomateddecisionsare—atbest—difficulttoexplainandjustify.Appealingsuchdecisionsisevenharderwhenwefallintothetrapofthinkingdataandalgorithmscombinetocreateobjectivetruth.Withgreaterdecision-makingpowercomesmuchgreaterresponsibility,andhumanswillincreasinglybeheldaccountablefortheimpactofdecisionstheirbusinessmakes.”

THE END
1.机器学习特征工程,全面指南!51CTO博客特征机器学习特征工程和选择是将数据转化为最佳表示的艺术,以大大提升机器学习的效果。本指南是初学者的简明参考,提供了最简单但广泛使用的特征工程和选择技术。 1 基本概念 1.1 什么是机器学习 机器学习是让计算机在没有明确编程的情况下进行操作的学科——阿瑟·塞缪尔 机器学习是一种数据科学技术,它帮助计算机从https://blog.51cto.com/u_15671528/12853750
2.Microsoft机器学习产品和技术概述Azure Data Science Virtual Machine使用预安装的数据科学工具的虚拟机映像使用 Jupyter、R 和 Python 等工具在自己的 VM 上开发机器学习解决方案。 ML.NET开源的跨平台机器学习 SDK开发适用于 .NET 应用程序的机器学习解决方案。 Windows AIWindows 设备上的已训练模型的推理引擎将人工智能功能集成到 Windows 应用程序https://docs.microsoft.com/zh-cn/azure/machine-learning/service/overview-more-machine-learning
3.人工智能基础机器学习入门指南机器学习是一种数据分析技术,它允许计算机系统通过经验自动改善其性能。这种方法的核心在于算法,这些算法能够从数据中学习,并根据这些数据做出预测或决策。 为何需要学机器学习? 在现代数字化时代,数据驱动的决策变得越来越重要。然而,处理和分析大量复杂的数据集并非易事。因此,了解和掌握机器学习技术对于任何希望利用大数https://www.206sk8xl.cn/zhi-neng/596412.html
4.ACC.24丨聚焦血脂领域,盘点即将公布的最新研究进展!医药新闻1118. It's not just About the LDL: Complexities in Cholesterol Management 北京时间:23:00 ESOPHAGEAL INVOLVEMENT OF STATIN-INDUCED NECROTIZING AUTOIMMUNE MYOSITIS, A HARD PILL TO SWALLOW 难以吞咽的他汀类药物诱导的坏死性自身免疫性肌炎的食管受累 https://bydrug.pharmcube.com/news/detail/f32d3541817104045c1a61f05ffaf772
5.50Gbit/sEPON中基于预测的多波长带宽分配算法期刊[3]苏彩玉,万海斌.基于改进机器学习的无人机中继通信数据调度控制研究[J].计算机测量与控制.2024,32(5).DOI:10.16526/j.cnki.11-4762/tp.2024.05.016. 光通信研究 北大核心 ISSN:1005-8788 年,卷(期):2021(5) 所属栏目:光通信系统与网络技术 https://d.wanfangdata.com.cn/periodical/gtxyj202105003
6.GitHubpassats/GitHubChineseTopskywind3000/awesome-cheatsheets 超级速查表 - 编程语言、框架和开发工具的速查表,单个文件包含一切你需要知道的东西 ? 6.2k Shell 08/12 248deeplearning-ai/machine-learning-yearning-cn Machine Learning Yearning 中文版 - 《机器学习训练秘籍》 - Andrew Ng 著 6.2k CSS 04/05 249yifeikong/reverse-https://github.com/passats/GitHub-Chinese-Top-Charts/tree/0d1513dd64f6d985a72d257b7672bcdd8a4aa348
7.PyTorch2.2中文官方教程(三)(2)布客飞龙 | 7月前 | 机器学习/深度学习 PyTorch 算法框架/工具 PyTorch 2.2 中文官方教程(十八)(4) PyTorch 2.2 中文官方教程(十八) 112 1 1 布客飞龙 | 7月前 | PyTorch 算法框架/工具 异构计算 PyTorch 2.2 中文官方教程(二十)(4) PyTorch 2.2 中文官方教程(二十) 130 0 0 布客飞龙 | 7https://developer.aliyun.com/article/1482488
8.一直r198it‘snotatwowayplottype怎么办?求助各位大神,一作图他就提示r198 it‘s not a twoway plot type怎么办? code 如下 twoway (connected m_employmentrate year2 if graphobs == 1 & T==1, m(O) lc(navy) mc(navy)) /// > (connected m_employmentrate year2 if graphobs == 1 & T==0, m(Th) lc(maroon) mc(maroon)) https://bbs.pinggu.org/jg/kaoyankaobo_kaoyan_6363201_1.html
9.机器学习:开启智能未来的钥匙腾讯云开发者社区机器学习作为人工智能的核心方法,通过分析数据中的隐藏规律,让计算机从中获取新的经验和知识,不断提升和改善自身性能,从而像人一样根据所学知识做出决策。 机器学习涉及概率论、统计学、微积分、代数学、算法复杂度理论等多门学科,是一门多领域交叉学科。其应用范围极为广泛,涵盖自然语言处理、图像识别、推荐系统、金融https://cloud.tencent.com/developer/article/2478495
10.第21届WebbyAwards威比奖广告与媒体类获奖作品精选由于公众社交媒体上是不允许发布裸露的照片,所以这次活动主题" CHECK IT BEFORE IT'S REMOVED " 显然一语双关,巧妙类比 Facbook 和 Instagram 严格的审查制度,让年轻女性从中感受到此事的急迫性。 Agency: DDB Group Germany Best User Experience 最佳用户体验/https://www.digitaling.com/articles/37419.html
11.杰夫贝佐斯写给股东们的信It'sAllAboutLongTerm“我们正处在显而易见的大趋势中:机器学习和人工智能。” “大部分机器学习带来的影响都是这样,潜移默化地改变了我们的核心的运作方式。” /高速决策/ “绝对不要使用一刀切的决策流程,很多决策都是有回路的,这些决策的过程可以更轻量化。” “不同意,但执行。” https://www.jianshu.com/p/ffc4a1af8669
12.It’sabinaryworld,这是一个要和不要的世界我认为,随着推荐算法,机器学习以及真人工智能的进步,我们人类正在通过一个又一个号称”更懂你“的应用程式,逐渐把绝大多数用户的生物大脑转化为机械开关:你就说你要还是不要,剩下的你不用管,怎么做你更不用管。换句话说,我们逐渐贡献我们的各种数据给机器,以换来在每一个场景下的”傻瓜化“。https://www.tmtpost.com/177723.html
13.nvidialogoNeMo Curator and Cosmos Tokenizers Supercharge Developers Just announced—NVIDIA NeMo? will support end-to-end pipeline for developing multimodal models. Generative AI?|?Blog Consulting Giants Team With NVIDIA for the Era of AI IT giants creating jobs, training over half a million developershttps://www.nvidia.com/
14.Askforadoctorasquicklyaspossibleandtellhimit'sa( )是机器学习中一种基于对数据进行表征学习的方法,是一种能够模拟出人脑的神经结构的机器学习方法 A. 人工智能 B. 深度学习 C. 人工神经网络 查看完整题目与答案 下列指标中,与顾客目标有关的是() A. 提高产品质量 B. 股票收益性 C. 工资水平 D. 降低产品价格 E. 改善服务水平https://www.shuashuati.com/ti/b754531da3f74b2aafe4c0e590a248eb.html?fm=bdbds854b5134c61c52f14b3b1c74b696bd26
15.位华人科学家当选占比超20%,获75000美元科研奖金Simon Shaolei Du (杜少雷),华盛顿大学 杜少雷目前是华盛顿大学 Paul G. Allen 计算机科学与工程学院的助理教授。他的研究兴趣广泛地集中在机器学习方面,如深度学习、表征学习和强化学习。 在入职华盛顿大学之前,他曾是普林斯顿高级研究所的博士后,导师是 Sanjeev Arora。他还在 CMU 获得了博士学位,导师是 Aarti Singhhttps://www.ithome.com/0/751/327.htm
16.文本分类(1)文本预处理文本分类it's替换为tis预处理过程中需要把英文缩写进行替换,如it’s和it is是等价的,won’t和will not也是等价的,等等。 text = "The story loses its bite in a last-minute happy ending that's even less plausible than the rest of the picture ." text.replace("that's", "that is") https://blog.csdn.net/weixin_44766179/article/details/89855100
17.分词技术(精选十篇)[1]http://forfuture1978.iteye.com/blog/691017. [2]费洪晓,康松林,朱小娟,等.基于词频统计的中文分词的研究[J].计算机工程与应用,2005,(7):67-68. [3]吴应良,韦刚,李海.一种基于N-gram模型和机器学习的汉语分词算法[J].电子信息学报,2001,23(11):1148-1153. https://www.360wenmi.com/f/cnkeyotdwqmm.html
18.最强通用棋类AI,AlphaZero强化学习算法解读the best moves can involve sacrificing in the short-term to have better gains in the long-term. In the Dots and Boxes game, sometimes it’s better not to score a box to avoid gaining another turn, and instead, force the move back to the opponent. We would then have to tune our evalhttps://www.flyai.com/article/770
19.otter水獭实时英语音频翻译软件教育优惠edu邮箱注册申请直接用edu教育邮箱注册一个otter.ai账户,上面的教育优惠图里,点击里面蓝色框内容“Get Otter now, it’s free” edu电子邮件会收到一封Otter官方发来的确认邮件,请确认您的电邮地址 点击下面的按钮,以验证ajones@xxxx.edu是您在注册过程中提供的电子邮件地址。 登录主页 我们验证邮箱成功后会进入到Otter个人主页页https://www.liout.com/otter%E6%B0%B4%E7%8D%AD%E5%AE%9E%E6%97%B6%E8%8B%B1%E8%AF%AD%E9%9F%B3%E9%A2%91%E7%BF%BB%E8%AF%91%E8%BD%AF%E4%BB%B6%E6%95%99%E8%82%B2%E4%BC%98%E6%83%A0edu%E9%82%AE%E7%AE%B1%E6%B3%A8%E5%86%8C%E7%94%B3.html
20.译科技什么?!有人模仿你的脸,还有人模仿你全身?新闻频道例如,一个人在深度换脸视频中戴了与其不相配的耳环。而在2018年9月,人工智能基金会筹集了1000万美元,通过机器学习和人类调解员创建了一个识别深度换脸和其他恶意内容的工具。 但是,托马斯仍然怀疑技术是否能完全解决深度换脸的问题,不管它们采取什么形式。她认为建立更好的系统来识别深度换脸是有价值的,但她重申,其他https://news.hexun.com/2019-09-29/198722790.html
21.awesomegoshield star:152 贝叶斯文本分类器,具有灵活的tokenizers和存储后端。 go-fann star:112 快速人工神经网络(FANN)库的Go bindings。 go-featureprocessing star:88 快速和方便的特征处理,低延迟机器学习在Go。 goscore star:85 为预言模型标记语言(PMML)实现的评分API。 gonet star:77 基于go的神经网络。 https://gitea.mrx.ltd/Go-pkg/awesome-go-cn/src/commit/718c7bcaa421d50c5aba70af947383044aaa9dd3/README.md
22.姑息治疗:不只是临终关怀MOOC中国Easing Physical Symptoms: It's Not Just Hospice Anymore Palliative care provides important support for people living with serious or life-limiting illnesses and their family caregivers. In this course, you will learn to use symptom assessment tools to better understand which symptoms are present andhttps://www.cmooc.com/course/23173.html
23.Here’swhyApplebelievesit’sanAIleader—andwhyitIt's used for live translation in iOS 14. Apple It's used for live translation in iOS 14.Apple AI is behind the automatic positioning of home screen widgets. Apple AI is behind the automatic positioning of home screen widgets.Apple http://arstechnica.com/gadgets/2020/08/apple-explains-how-it-uses-machine-learning-across-ios-and-soon-macos/
24.it’s+dangerous+to+Don’t+run+on+the+road为什么要Don’t句子 “it’s dangerous to Don’t run on the road” 包含了一个错误。正确的表达应该是:1. “It’s dangerous to run on the road”:这句话表示在道路上跑步是危险的,提醒人们不要在道路上跑步,因为可能会发生交通事故或其他危险。2. “Don’t run on the road”:这是一句明确的命令https://wen.baidu.com/question/1807380912271782507.html