参加美赛部分题目需要自己搜集数据完成竞赛,数乐君今天给大家整理了很多数据库,很多有趣的数据自己动动手就可以得到了。当然肯定还有很多专业性很强的数据库,但那些很多还是要权限,要收费的。不过这都可以理解,越宝贵的数据肯定越难获得,比较得到那些数据花费的功夫还是挺大的。
这些网站有的需要一些手段才能登陆,但这不是主要问题。希望以后大家查资料都能顺顺利利,嘿嘿。
还要再提一下,一定要留意年报,年鉴,yearbook这种东西,妙不可言。很多专业都能从中获得到自己需要的各类信息!
一、可以查询美国各个领域经济指标的网站:
U.S.EnergyInformationAdministration(EIA)[www.eia.gov!
www.mql5.com经济统计指标-MBA智库百科wiki.mbalib.com
二、各国统计数据网站大全
中国国家统计局:
中国国民经济核算体系(2002)
中国国家统计局(统计标准)
中国国家统计局(统计制度)
中国国家统计局(统计数据)
中国国家统计局(统计公报)
中国国家外汇管理局(国际收支平衡表,国际投资头寸表、外汇储备、汇率等)
联合国统计处
国民经济核算体系(SNA-1993)
综合环境经济核算(SEEA-2003)
投入产出表的编制和分析手册(SeriesF,No.74,1999)
国际货币基金组织
国际收支手册(BOP-1993)
国际收支手册第五版补编:衍生金融工具(2000)
货币与金融统计手册(MFS-2000)
政府财政统计手册(GFS-2001)
国际清算银行(统计数据)
OECD国民核算资料
欧盟统计局
各国统计机构:
美国商务部经济分析局(BEA,国民核算)
美国劳工统计局
加拿大统计局
英国统计局(国民核算指南)
法国国家统计经济研究所(核算数据更新)
德国联邦统计局(国民核算资料)
爱尔兰中央统计办公室(核算数据)
瑞典统计局(核算数据)
澳大利亚统计局(统计方法与标准)
新西兰统计局(统计方法与标准)
日本社会经济研究所(国民核算数据)
三、国内外灾害数据库汇总
国外尤其是发达国家特别重视灾害数据库建设及灾害数据信息共享,已建成的灾害数据库一般都可通过互联网进行访问。表1列出了15个国外主要的灾害数据库,包括联合国开发计划署(UNDP)、欧盟(EU)、世界卫生组织(WHO)、美国、日本、加拿大、澳大利亚和比利时等国际组织和国家组织建设的各类灾害数据库(含全球性的或本国内的)。美国对灾害数据库的建设贡献甚大,不仅建成了全球性的综合灾害数据库,还建成了包括海啸、地震等在内的各类专题灾害数据库。国外尤其是发达国家的灾害数据库在建设时就考虑到了数据共享的需要,在数量、可访问性到记录灾害种类(复合灾害群)、检索条件及查询结果等的设计上均有利于灾害信息在本国及国际范围的流通与共享,灾害数据库建设较为规范,灾害数据信息共享程度高。
美国统计局(统计调查局或普查局)官方网站
TheCensusBureauWebSiteprovideson-lineaccesstoourdata,publications,andproducts.
美国劳工部
OfficialwebsiteofBureau,withnews,currentdata,articles,linksandotherinformationaboutemployment,wages,workingandtheeconomy.
美国商务部的官方网站
ServiceoftheUSDepartmentofCommerceprovidesmarketresearchandbusinessdata.
OECD的官方网站
美国国际贸易委员会
6
美国总统经济报告历年的的PDF文本下载,以及历年的有关数据下载,绝对权威,非常有用。
7
美国贸易谈判代表办公室官方网站,每年都有关于贸易壁垒的评估报告,可以下载。
欧盟对外贸易数据
欧盟官方网站,本网页是关于欧盟与美国关系的,有数据可用
美国驻欧盟官方网站,和上面一个同样重要。
美国国务院欧盟事务局官方网站,
美国驻英国大使馆官方网站
美国资讯网,是研究美国经济、文化、历史很好的一个网站,有很多美国经济方面的信息和资料。
欧盟与美国的贸易有关统计
16、
美国商务部
17、
世界贸易组织
美国驻奥地利大使馆(有很多有用的资料)
18、
美国驻英国大使馆
19、
一个特别有用的关于美国和欧盟关系的网站,资料颇多。
20、
美国进出口数据的非常好的一个网站
21、
列举了很多有关美国贸易和经济数据查询的链接
五、国外统计学网址
2.国内统计学网址
www.stats.gov.cn中国统计信息网
4软件
六、全球及各国重要数据网站集锦
2、数字世界:
数据:实体经济和虚拟经济股票、债券交易量以及市场价值。
3、世界银行数据库:(select)
数据:全球宏观实体经济数据
4、世界发展指标
数据:全球宏观经济数据
5、世界银行中文版:
数据:全球经济发展展望和金融发展报告
6、IFS数据库:(select)
数据:实体经济(GDP、投资)CPI、货币供应量等。
7、联合国统计网:
数据:全球报告国家经济数据
8、国际清算银行:
数据:债券(国际债券、国内债券)、国际股票、衍生品未清偿合约的名义数额和总市场价值(OTC、交易所)。
9、全球金融数据网
数据:部分免费金融数据
10、美国联邦储备局:
11、OECD数据库
数据:G10国家数据
OECDHealthDatawebsite:www.oecd.org/health/healthdata
12、全球金融稳定报告—市场发展与问题
数据:本报告2002年3首次发行,替代了原有的全球资本市场年度报告和新兴金融市场季度报告。
13、世界经济展望数据库
数据:全球实体经济数据
14、美国商业部门经济分析局
数据:美国和部分国际数据
15、YAHOO金融
数据:全球股票交易指标
16、公司金融数据库
数据:美国、欧洲以及部分新兴市场、亚洲国家企业金融数据
17、债券市场
数据:美国及全球部分公司、政府债券交易数据
18、世界经济统计资料:
数据:全球实体经济与股市和债券交易量
19、日本统计年鉴
网站:www.stat.go.jp/english/data/nenkan/index.htm
数据:日本宏观经济数据
20、中国统计年鉴
数据:中国宏观经济数据
21、联邦储备存款保险公司
数据:美国各类大小银行数据
22、美国劳工部
数据:美国实体经济主要数据指标
23、中经专网
数据:中国宏观经济数据和地区数据
24、经济数据
数据:中国与全球宏观经济与金融数据库
25、财经数据库
数据:全国与地区经济数据
26、世界经济统计资料
数据:国内整理的世界经济数据
27、中国经济门户网
数据:中国宏观经济与金融数据
28、南开大学政治经济学研究中心
数据:金融年鉴
29、中国统计年鉴(1996-2003)
30、中国人民银行
数据:货币供应、银行资产
数据:中国期货交易数据
七、常见数据收集网站:
一.由简单和通用的数据集开始
这是美国政府公开数据的所在地,该站点包含了超过19万的数据点。这些数据集不同于气候、教育、能源、金融和更多领域的数据。
这是印度政府公开数据的所在地,通过各种行业、气候、医疗保健等来寻找数据,你可以在这里找到一些灵感。根据你居住的国家的不同,你也可以从其他一些网站上浏览类似的网站。
世界银行的开放数据。该平台提供OpenDataCatalog,世界发展指数,教育指数等几个工具。
印度储备银行提供的数据。这包括了货币市场操作、收支平衡、银行使用和一些产品的几个指标。
二.大型数据集
1.AmazonWebServices(AWS)datasets
Amazon提供了一些大数据集,可以在他们的平台上使用,也可以在本地计算机上使用。您还可以通过EMR使用EC2和Hadoop来分析云中的数据。在亚马逊上流行的数据集包括完整的安然电子邮件数据集,GoogleBooksn-gram,NASANEX数据集,百万歌曲数据集等。
2.Googledatasets
3.YoutubelabeledVideoDataset
四.预测建模与机器学习数据集
1.UCIMachineLearningRepository
2.Kaggle
Kaggle提出了一个平台,人们可以贡献数据集,其他社区成员可以投票并运行内核/脚本。他们总共有超过350个数据集——有超过200个特征数据集。虽然一些最初的数据集通常出现在其他地方,但我在平台上看到了一些有趣的数据集,而不是在其他地方出现。与新的数据集一起,界面的另一个好处是,您可以在相同的界面上看到来自社区成员的脚本和问题。
3.AnalyticsVidhya
您可以从我们的实践问题和黑客马拉松问题中参与和下载数据集。问题数据集基于真实的行业问题,并且相对较小,因为它们意味着2-7天的黑客马拉松。
4.Quandl
5.PastKDDCups
KDDCup是ACMSpecialInterestGroup组织的年度数据挖掘和知识发现竞赛。
6.DrivenData
DrivenData发现运用数据科学带来积极社会影响的现实问题。然后,他们为数据科学家组织在线模拟竞赛,从而开发出最好的模型来解决这些问题。
三.图像分类数据集
1.TheMNISTDatabase
最流行的图像识别数据集,使用手写数字。它包括6万个示例和1万个示例的测试集。这通常是第一个进行图像识别的数据集。
2.Chars74K
这里是下一阶段的进化,如果你已经通过了手写的数字。该数据集包括自然图像中的字符识别。数据集包含74,000个图像,因此数据集的名称。
3.FrontalFaceImages
如果你已经完成了前两个项目,并且能够识别数字和字符,这是图像识别中的下一个挑战级别——正面人脸图像。这些图像是由CMU&MIT收集的,排列在四个文件夹中。
4.ImageNet
现在是时候构建一些通用的东西了。根据WordNet层次结构组织的图像数据库(目前仅为名词)。层次结构的每个节点都由数百个图像描述。目前,该集合平均每个节点有超过500个图像(而且还在增加)。
四.文本分类数据集
1.Spam–NonSpam
区分短信是否为垃圾邮件是一个有趣的问题。你需要构建一个分类器将短信进行分类。
2.TwitterSentimentAnalysis
该数据集包含1578627个分类推文,每行被标记为1的积极情绪,0位负面情绪。数据依次基于Kaggle比赛和NickSanders的分析。
3.MovieReviewData
五.推荐引擎数据集
1.MovieLens
MovieLens是一个帮助人们查找电影的网站。它有成千上万的注册用户。他们进行自动内容推荐,推荐界面,基于标签的推荐页面等在线实验。这些数据集可供下载,可用于创建自己的推荐系统。
2.Jester
在线笑话推荐系统。
1.KDNuggets
2.AwesomePublicDatasets
一个GitHub存储库,它包含一个由域分类的完整的数据集列表。数据集被整齐地分类在不同的领域,这是非常有用的。但是,对于存储库本身的数据集没有描述,这可能使它非常有用。
3.RedditDatasetsSubreddit
重磅:2023年美国大学生数学建模竞赛报名正在进行中
截止到当前,2023年美赛报名已达904支队伍。近2700多人报名参赛。
数模乐园作为国内美赛报名最大官方平台
为参加美赛的同学解决国际支付报名难的问题
为同学们省去大部分繁琐流程的同时
还附赠纸质证书打印邮寄、美赛赛题解析、美赛专属礼包、赛题翻译等备赛资料