终于把所有的Python库,都整理出来啦!

Chardet字符编码探测器,可以自动检测文本、网页、xml的编码。

colorama主要用来给文本添加各种颜色,并且非常简单易用。

Prettytable主要用于在终端或浏览器端构建格式化的输出。

difflib,[Python]标准库,计算文本差异

Levenshtein,快速计算字符串相似度。

fuzzywuzzy,字符串模糊匹配。

esmre,正则表达式的加速器。

shortuuid,一组简洁URL/UUID函数库。

ftfy,Unicode文本工具7

unidecode,ascii和Unicode文本转换函数。

xpinyin,将汉字转换为拼音的函数库

pangu.py,调整对中日韩文字当中的字母、数字间距。

pyfiglet,Python写的figlet程序,使用字符组成ASCII艺术图片

uniout,提取字符串中可读写的字符

awesomeslugify,一个Pythonslugify库,用于处理Unicode。

python-slugify,转换Unicode为ASCII内码的slugify函数库。

unicode-slugify,生成unicode内码,Django的依赖包。

ply,Python版的lex和yacc的解析工具

python-user-agents,浏览器的用户代理(user-agents)的解析器。

sqlparse,SQL解析器。

pygments,一个通用的语法高亮工具。

python-nameparser,解析人名,分解为单独的成分。

pyparsing,通用解析器生成框架。

tablib,表格数据格式,包括,XLS、CSV,JSON,YAML。

python-docx,docx文档读取,查询和修改,微软Word2007/2008的docx文件。

xlwt/xlrd,读写Excel格式的数据文件。

xlsxwriter,创建Excel格式的xlsx文件。

xlwings,利用Python调用Excel

csvkit,CSV文件工具包。

marmir,把Python[数据结构],转化为电子表格。

pdfminer,从PDF文件中提取信息。

pypdf2,合并和转换PDF页面的函数库。

Python-Markdown,轻量级标记语言Markdown的Python实现。

Mistune,,快速、全功能的纯Python编写的Markdown解释器。

dateutil,标准的Python官方datetime模块的扩展包,字符串日期工具,其中parser是根据字符串解析成datetime,而rrule是则是根据定义的规则来生成datetime。

pytz,世界时区,使用tzdatabase时区信息[数据库]

BeautifulSoup,基于Python的HTML/XML解析器,简单易用,功能很强大,即使是有bug,有问题的html代码,也可以解析

lxml,快速,易用、灵活的HTML和XML处理库,功能超强,在遇到有缺陷、不规范的xml时,Python自带的xml处理器可能无法解析。报错时,程序会尝试再用lxml的修复模式解析

。htmlparser,官方版解析HTMLDOM树,偶尔搞搞命令行自动表单提交用得上。

pyyaml,Python版本的YAML解释器。

html5lib,-标准库,解析和序列化HTML文档和片段。

pyquery,类似[jQuery]的的HTML解释器函数库。

cssutils,PythonCSS库。

MarkupSafe,XML或HTML/XHTML安全字符串标记工具。

cssutils-ACSSlibraryforPython.,MarkupSafe-ImplementsaXML/HTML/XHTMLbleach,漂白,基于HTML的白名单函数库。

xmltodict,类似JSON的XML工具包。

xhtml2pdf,HTML/CSS格式转换器,看生成pdf文档。

untangle,把XML文档,转换为Python对象,方便访问。

库名称简介Mimetypes,Python标准库,映射文件名到MIME类型。

imghdr,Python标准库,确定图像类型。python-magic,libmagic文件类型识别库,Python接口格式。path.py,os.path模块的二次封装。

watchdog,一组API和shell实用程序,用于监视文件系统事件。

Unipath,面向对象的文件/目录的操作工具包。pathlib,-(Python3.4版已经作为Python标准库),一个跨平台,面向path的函数库。

pickle/cPickle,python的pickle模块实现了基本的数据序列和反序列化。通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去,永久存储;通过pickle模块的反序列化操作,我们能够从文件中创建上一次程序保存的对象。

cPickle是[C语言]实现的版本,速度更快。

ConfigParser,Python标准库,INI文件解析器。

configobj,INI文件解析器。config,分层次配置,logging作者编写。

profig,多格式配置转换工具。

logging,Python标准库,日志文件生成管理函数库。

logbook,logging的替换品。

Sentry,实时log服务器。Raven,哨兵Sentry的Python客户端。

Sphinx,斯芬克斯(狮身人面像),Python文档生成器。

reStructuredText,标记语法和解析工具,Docutils组件。mkdocs,Markdown格式文档生成器。

pycco,简单快速、编程风格的文档生成器。

pdoc,自动生成的Python库API文档epydoc,从源码注释中生成各种格式文档的工具

PIL(PythonImageLibrary),基于Python的图像处理库,功能强大,对图形文件的格式支持广泛,内置许多图像处理函数,如图像增强、滤波[算法]等Pillow,图像处理库,PIL图像库的分支和升级替代产品。Matplotlib,著名的绘图库,提供了整套和matlab相似的命令API,用以绘制一些高质量的数学二维图形,十分适合交互式地进行制图。brewer2mpl,有一个专业的python配色工具包,提供了从美术角度来讲的精美配色。

PyGame基于Python的多媒体开发和游戏软件开发模块,包含大量游戏和图像处理功能Box2d,开源的2d物理引擎,愤怒的小鸟就是使用了这款物理引擎进行开发的,Box2d物理引擎内部模拟了一个世界,你可以设置这个世界里的重力,然后往这个世界里添加各种物体,以及他们的一些物理特性,比如质量,摩擦,阻尼等等。

Pymunk,类似box2d的开源物理图形模拟库OpenCV,目前最好的开源图像/视觉库,包括图像处理和计算机视觉方面、[机器学习]的很多通用算法。SimpleCV,计算机视觉开源框架,类似opencv。VTK,视觉化工具函式库(VTK,VisualizationToolkit)是一个开放源码,跨平台、支援平行处理(VTK曾用于处理大小近乎1个Petabyte的资料,其平台为美国LosAlamos国家实验室所有的具1024个处理器之大型系统)的图形应用函式库。

2005年时曾被美国陆军研究实验室用于即时模拟俄罗斯制反导弹战车ZSU23-4受到平面波攻击的情形,其计算节点高达2.5兆个之多。cgkit,PythonComputerGraphicsKit,其module主要分两个部分,

Aggdraw,开源图像库,几乎涵盖了2dimage操作的所有功能,使用起来非常灵活Pycairo,开源矢量绘图库Cairo开罗的python接口,cairo提供在多个背景下做2-D的绘图,高级的更可以使用硬件加速功能。wand,Python绑定魔杖工具(MagickWand),C语言API接口。

thumbor,-智能成像工具,可调整大小和翻转图像。

imgSeek,查询相似的图像。

python-qrcode,纯Python的二维码(QR码)生成器。

pyBarcode,创建条码,无需PIL模块。

pygram,Instagram像图像过滤器。

Quads,基于四叉树的计算机艺术。

nude.py,裸体检测函数。

scikit-image,scikit工具箱的图像处理库。

hmap,图像直方图工具。

bokeh,交互的Web绘图。

plotly,Web协同的Python和Matplotlib绘制。

vincent,文森特,PythonVega的函数库。

d3py,Python绘图库,基于D3.JS,ggplot-API兼容R语言的ggplot2.Kartograph.py,在Python绘制漂亮的SVG地图。pygal,SVG图表的创造者。

pygraphviz,Graphviz的Python接口。

Fonttlools,ttf字体工具函数包,用于fontforge、ttx等字体软件。

库名称简介audiolazy,数字信号处理(DSP)的Python工具包。

audioread,跨平台(GStreamerCoreAudioMADFFmpeg)音频解码库。beets,音乐库管理。

dejavu,音频指纹识别算法。

Dejavu听一次音频后就会记录该音频的指纹信息,然后可通过麦克风对输入的音频进行识别是否同一首歌。django-elastic-transcoder,Django亚马逊elastic转码。eyeD3,音频文件工具,特别是MP3文件包含的ID3元数据。

id3reader,用于读取MP3的元数据。

mutagen,处理音频元数据。

pydub,-操纵音频和简单的高层次的接口。

pyechonest,EchoNestAPI客户端。talkbox,语音和信号处理的Python库。

TimeSide,开放的网络音频处理框架。

tinytag,读取音乐文件元数据,包括的MP3,OGG,FLAC和wave文件。

m3u8,用于解析m3u8文件。

moviepy,多格式视频编辑脚本模块,包括GIF动画。

scikit视频,SciPy视频处理例程。

GeoDjango,一个世界级的地理Web框架。

geopy,Geo地理编码的工具箱。

pygeoip,纯Python写的GeoIPAPI。

GeoIP,PythonAPI接口,使用高精度GeoIPLegacyDatabase数据库。

geojson,GeoJSON函数库django-countries,一个Django程序,提供国家选择,国旗图标的静态文件,和一个国家的地域模型。

Pygame,Python游戏设计模块。

Cocos2d,2D游戏框架,演示,和其他的图形/交互应用,基于pyglet。Cocos2d-cocos2disaframeworkforbuilding2Dgames,demos,andothergraphical/interactiveapplications.Itisbasedonpyglet.,PySDL2,SDL2的封装库。

Panda3D-3D游戏引擎,迪士尼开发。

PySFML,Python绑定SFMLRenPy,视觉小说引擎。

OpenMining,商业智能(BI),Pandas的Web界面。blaze,NumPy和Pandas大数据界面。SciPy,开源的Python算法库和数学工具包,SciPy包含的模块有最优化、线性代数、积分、插值、特殊函数、快速傅里叶变换、信号处理和图像处理、常微分方程求解和其他科学与工程中常用的计算。

其功能与软件MATLAB、Scilab和GNUOctave类似。

Numpy和Scipy常常结合着使用,Python大多数机器学习库都依赖于这两个模块。

ScientificPython,一组经过挑选的Python程序模块,用于科学计算,包括几何学(矢量、张量、变换、矢量和张量场),四元数,自动求导数,(线性)插值,多项式,基础统计学,非线性最小二乘拟合,单位计算,Fortran兼容的文本格式,通过VRML的3D显示,以及两个Tk小工具,分别用于绘制线图和3D网格模型。此外还具有到netCDF,MPI和BSPlib库的接口。

NumPy科学计算库,提供了矩阵,线性代数,傅立叶变换等等的解决方案,最常用的是它的N维数组对象.NumPy提供了两种基本的对象:ndarray(N-dimensionalarrayobject)和ufunc(universalfunctionobject)。

ndarray是存储单一数据类型的多维数组,而ufunc则是能够对数组进行处理的函数。Cvxopt,最优化计算包,可进行线性规划、二次规划、半正定规划等的计算。Numba,科学计算速度优化编译器。pymvpa2,是为大数据集提供统计学习分析的Python工具包,它提供了一个灵活可扩展的框架。

它提供的功能有分类、回归、特征选择、数据导入导出、可视化等NetworkX,复杂网络的优化软件包。zipline,交易算法的函数库。

PyDy,Python动态建模函数库。

SymPy,符号数学的Python库。statsmodels,Python的统计建模和计量经济学。

astropy,天文学界的Python库。

orange,橙色,数据挖掘,数据可视化,通过可视化编程或Python脚本学习机分析。RDKit,化学信息学和机器学习的软件。

OpenBabel,巴贝尔,开放的化学工具箱。

cclib,化学软件包的计算函数库。

Biopython,免费的生物计算工具包。

visvis,可视化计算模块库,可进行一维到四维数据的可视化。

MapReduce是Google提出的一个软件[架构],用于大规模数据集(大于1TB)的并行运算。概念“Map(映射)”和“Reduce(归纳)”,及他们的主要思想,都是从函数式编程语言借来的MapReduce函数库。FramworksandlibrariesforMapReduce.,PySpark,[Spark]的PythonAPI。dpark,Spark的Python克隆,Python中的MapReduce框架。luigi,为批量工作,建立复杂的管道。mrjob,运行在[Hadoop],或亚马逊网络服务的,MapReduce工作。

库名称简介NLTK(naturallanguagetoolkit),是python的自然语言处理工具包。2001年推出,包括了大量的词料库,以及自然语言处理方面的算法实现:分词,词根计算,分类,语义分析等。

Pattern,数据挖掘模块,包括自然语言处理,机器学习工具,等等。

textblob,提供API为自然语言处理、分解NLP任务。基于NLTK和Pattern模块。

jieba,结巴,中文分词工具。snownlp,用于处理中文文本库。

loso,中文分词函数库。

genius,中文CRF基础库,条件随机场(conditionalrandomfield,简称CRF),是一种鉴别式机率模型,是随机场的一种,常用于标注或分析序列资料,如自然语言文字或是生物序列Gensim,一个相当专业的主题模型Python工具包,无论是代码还是文档,

可用于如何计算两个文档的相似度LIBSVM,是台湾大学林智仁(LinChih-Jen)教授等开发设计的一个简单、易于使用和快速有效的SVM模式识别与回归的软件包,他不但提供了编译好的可在Windows系列系统的执行文件,还提供了源代码,方便改进、修改以及在其它[操作系统]上应用;

该软件对SVM所涉及的参数调节相对比较少,提供了很多的默认参数,利用这些默认参数可以解决很多问题;并提供了交互检验(CrossValidation)的功能。

该软件可以解决C-SVM、ν-SVM、ε-SVR和ν-SVR等问题,包括基于一对一算法的多类模式识别问题。

scikits.learn,构建在SciPy之上用于机器学习的Python模块。它包括简单而高效的工具,可用于数据挖掘和数据分析。

涵盖分类,回归和聚类算法,例如SVM,逻辑回归,朴素贝叶斯,随机森林,k-means等算法,代码和文档都非常不错,在许多Python项目中都有应用。

例如在我们熟悉的NLTK中,分类器方面就有专门针对scikit-learn的接口,可以调用scikit-learn的分类算法以及训练数据来训练分类器模型。PyMC,机器学习采样工具包,scikit-learn似乎是所有人的宠儿,有人认为,PyMC更有魅力。

PyMC主要用来做Bayesian分析。Orange,基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能。

侧重数据挖掘,可以用可视化语言或Python进行操作,拥有机器学习组件,还具有生物信息学以及文本挖掘的插件。

Milk,机器学习工具箱,其重点是提供监督分类法与几种有效的分类分析:SVMs(基于libsvm),K-NN,随机森林经济和决策树。

它还可以进行特征选择。这些分类可以在许多方面相结合,形成不同的分类系统。对于无监督学习,它提供K-means和affinitypropagation聚类算法。

PyMVPA(MultivariatePatternAnalysisinPython),是为大数据集提供统计学习分析的Python工具包,它提供了一个灵活可扩展的框架。它提供的功能有分类、回归、特征选择、数据导入导出、可视化等NuPIC,开源人工智能平台。

该项目由Grok(原名Numenta)公司开发,其中包括了公司的算法和软件架构。

NuPIC的运作接近于人脑,“当模式变化的时候,它会忘掉旧模式,记忆新模式”。如人脑一样,CLA算法能够适应新的变化。Pylearn2,-基于Theano的机器学习库。

hebel,GPU加速,[深度学习]Python库。

gensim,机器学习库。pybrain,机器学习模块,它的目标是为机器学习任务提供灵活、易应、强大的机器学习算法。

pybrain包括神经网络、强化学习(及二者结合)、无监督学习、进化算法。以神经网络为核心,所有的训练方法都以神经网络为一个实例Mahout,是ApacheSoftwareFoundation(ASF)旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。

Mahout包含许多实现,包括聚类、分类、推荐过滤、频繁子项挖掘。此外,通过使用ApacheHadoop库,Mahout可以有效地扩展到云中。

Crab,灵活的,快速的推荐引擎。python-recsys,娱乐系统分析,推荐系统。vowpal_porpoise,VowpalWabbit轻量级Python封装。

Theano,用来定义、优化和模拟数学表达式计算,用于高效的解决多维数组的计算问题的python软件包。它使得写深度学习模型更加容易,同时也给出了一些关于在GPU上训练它们的选项。

库名称简介threading,Python标准线程库,更高级别的线程接口。

envoy,特使,Python子线程的函数库。

eventlet开销很少的多线程模块,使用的是greenthreads概念,例如,pool=eventlet.GreenPool(10000)这样一条语句便创建了一个可以处理10000个客户端连接的线程池。类似Gevent线程库Gevent,多线程模块pytools,著名的python通用函数、工具包SendKeys,键盘鼠标操作模块,模拟键盘鼠标模拟操作。

pyHook,基于Python的“钩子”库,主要用于监听当前电脑上鼠标和键盘的事件。这个库依赖于另一个Python库PyWin32,如同名字所显示的,PyWin32只能运行在Windows平台,所以PyHook也只能运行在Windows平台。

pstuil,跨平台地很方便获取和控制系统的进程,以及读取系统的CPU占用内存占用等信息.cement,一个轻量级的、功能齐全的命令行工具click,简单优雅的的命令行接口。

clint,Python命令行工具。cliff,创造多层次指令的命令行程序框架。

Clime,可以转换任何模块为多的CLI命令程序,无任何配置。

docopt,Python命令行参数分析器。pycli,命令行应用程序,支持的标准命令行解析,测井,单元[测试]和功能测试。

Gooey,打开命令行程序,作为为一个完整的GUI应用程序,cookiecutter,命令行工具,从cookiecutters(项目模板)创建项目。

例如,Python包项目,jQuery插件项目。

percol,为UNIX传统管道pipe命令,添加交互式选择风格。

rainbowstream,聪明和漂亮的推特客户终端。DjangoModels,Django的一部分SQLAlchemy,PythonSQL工具包和对象关系映射。

peewee,小型的ORM解析器。

PonyORM,为ORM提供了一种面向SQL的接口。MongoEngine,Python对象文件映射,使用[MongoDB]。

,DjangoMongoDB引擎MongoDB,Django后台。

django-mongodb-engine,Django后台.redisco,一个简单的模型和容器库,使用[Redis]flywheel,AmazonDynamoDB对象映射。

butterdb,谷歌电子表格的ORM,Python版。celery,芹菜,异步任务队列/工作,基于分布式消息队列。

huey,休伊,轻量级,多线程任务队列。

mrq,队列先生,分布式任务队列,使用redis&Gevent。rq,简单的工作队列。Queue,Queue模块可以用来实现多线程间通讯,让各个线程共享数据,生产者把货物放到Queue中,供消费者(线程)去使用。

simpleq,简单的,可扩展的队列,AmazonSQS基础队列。

Psyco,超强的python性能优化工具,psyco的神奇在于它只需要在代码的入口处调用短短两行代码,性能就能提升40%或更多,真可谓是立竿见影!如果你的客户觉得你的程序有点慢,敬请不要急着去优化代码,psyco或许能让他立即改变看法。

psyco堪称Python的jit。fn.py,Python函数编程:缺失的功能享受FP的实现。funcy,函数编程工具。Toolz,函数编程工具:迭代器、函数,字典。CyToolz,Toolz的Cython实现,高性能的函数编程工具。Ansible,安塞波,极为简单的自动化平台。

SaltStack,基础设施的自动化管理系统。

Fabric,织物,一个简单,远程执行和部署的语言工具。

Fabtools,Fabric的工具函数。

psutil,跨平台的过程和系统工具模块。

pexpect,控制互动节目。

provy,易于使用的配置系统的Python。honcho,Foreman的Python接口,用于管理procfile应用工具。

gunnery,多任务执行工具,与网络接口的分布式系统。

fig,快速。独立的开发环境中使用泊坞窗。

APScheduler,轻量级、但功能强大的在线任务调度程序。

django-schedule,Django日程应用程序。doit,任务流道/生成工具。

Joblib,Python提供的轻量级的流水线工具函数。

Plan,简易生成crontab文件。

Spiff,纯Python实现的,功能强大的工作流引擎。

schedule,Python作业调度。TaskFlow,有助于使任务执行简单。

ctypes,Python标准库,速度更快,Python调用C代码的外部函数接口。cffi,Python调用C代码外部函数接口,类似于ctypes直接在python程序中调用c程序,但是比ctypes更方便不要求编译成so再调用。

Cytoolz,python加速库SWIG,简化封装和接口生成器。

,Cython,Python优化静态编译器。

PyPy,Python解释器的Python实现。

StacklessPython,一个增强版本的Python。它使程序员从基于线程的编程方式中获得好处,并避免传统线程所带来的性能与复杂度问题。

Stackless为Python带来的微线程扩展,是一种低开销、轻量级的便利工具Pyston,使用LLVM和现代JIT技术,对python进行性能优化。

pythonlibs,非官方的Windows(32/64位)的Python扩展包scapy,优秀的数据包处理库。ino,Arduino命令行工具。Pyro,Python的机器人工具包。

pluginbase,一个简单而灵活的Python的插件系统。

itsdangerous,数据安全传输工具。blinker,快速Python中的信号/事件调度系统。

pychievements,用于创建和跟踪成果框架。

python-patterns,Python中的设计模式。

pefileWindowsPE文件解析器SIP,自动为C和C库生成Python扩展模块的工具

库名称简介MySQLdb,成熟的[MySQL]数据库模块,Baresql,SQL数据库包ZODB,Python本地对象数据库。一个K-V对象图数据库。

pickledb,简单和轻量级的K-V键值存储。

TinyDB,轻量级,面向文档的数据库。

mysql-python,MySQL的Python工具库。

mysqlclient,mysql-python分支,支持Python3.,PyMySQL,纯Python写的MySQL驱动程序,兼容mysql-python。mysql-connector-python,MySQL连接器,来自[Oracle],纯Python编写。oursql,MySQL连接器,提供本地话指令语句和BLOBs支持。

psycopg2,最流行的PythonPostgreSQL适配器。txpostgres,于Twisted的异步驱动,用于PostgreSQL。

queries,psycopg2函数库,用于PostgreSQL。

dataset,存储Python字典数据,用于SQLite,MySQL和PostgreSQL。

cassandra-python-driver,开源分布式NoSQL数据库系统ApacheCassandra系统的Python驱动.pycassa,简化的cassandra数据库Python驱动。

HappyBase,友好的Apache[Hbase]的函数库。

PyMongo,MongoDB官方客户端。

Plyvel,LevelDB快速和功能丰富的Python接口。redis-py,redis客户端。

py2neo,Python客户端(基于Neo4j的RESTful接口).telephus,基于Twisted的cassandra客户端。txRedis,基于Twisted的Redis客户端。

Curl,Pycurl包是一个libcurl的Python接口,它是由C语言编写的。

与urllib相比,它的速度要快很多。

Libcurl是一个支持FTP,FTPS,HTTP,HTTPS,GOPHER,TELNET,DICT,FILE和LDAP的客户端URL传输库.libcurl也支持HTTPS认证,HTTPPOST,HTTPPUT,FTP上传,代理,Cookies,基本身份验证,FTP文件断点继传,HTTP代理通道等等。

Requests,用Python语言编写,基于urllib的开源HTTP库。

它比urllib更加方便,更加Pythoner。

s3cmd,命令行工具,用于管理AmazonS3和CloudFront。

youtube-dl,命令行程序,从YouTube下载视频。

you-get,Python3写的视频下载工具,可用于YouTube/Youku优酷/Niconico视频下载

subliminal,命令行工具,搜索和下载字幕的函数库requests,HTTP函数库,更加人性化。grequests,异步HTTP请求Gevent(高性能高并发函数库)。

urllib3,一个线程安全的HTTP连接池,支持文件post。

POX,基于Python的开源软件定义网络(SDN)控制开发平台的应用,如OpenFlow的SDN控制器。

Pyretic,SDN的编程语言,提供了强大的抽象在网络交换机或仿真器。SDXPlatform,基于SDN的IXP实现,利用最小网络,痘和热。inbox.py,Python的SMTP服务器。imbox,Python版本IMAP库。inbox,收件箱,开源邮件工具包。

lamson,SMTP服务器。flanker,侧卫,电子邮件地址和MIME解析库。

marrow.mailer,高性能可扩展邮件交付框架。

django-celery-ses,Django电子邮件后台,使用AWSSES和Celery。

modoboa,邮件托管和管理平台,包括现代和简化WebUI。

envelopes,邮件工具。

mailjet,批量邮寄mailjetAPI接口,带统计。Talon,利爪,Mailgun库,提取消息和签名。mailjet-MailjetAPIimplementationforbatchmailing,statisticsandmore.,Talon-Mailgunlibrarytoextractmessagequotationsandsignatures.,pyzmail,编写,发送和解析电子邮件。furl,燃料,小型的的URL解析库库。purl,简单的,干净的API,操纵URL。

pyshorteners,纯Python库,URL短网址编辑。

short_url,短网址生成。

Scrapy,快速屏幕截取和网页抓取的框架。

portia,波西亚,Scrapy的可视化扩展。

feedparser,信息源解释器RoboBrowser,简单的网页浏览Python函数库,没有使用Web浏览器。

MechanicalSoup,网站自动化互动测试工具包。

mechanize,网页浏览编程工具。

Demiurge,造物主,-PyQuery的轻量级工具。

newspaper,提取报纸新闻。html2text,转换HTML为Markdown格式的文本。python-goose,HTML内容提取器。

lassie,莱西,人性化的网站内容检索。

micawber,通过UR抓提网页的函数库。

sumy,概要,文本和HTML网页的自动文摘模块。

Haul,距离,可扩展的图像爬虫。

python-readability,可读性工具Arc90,快速的Python接口。

opengraph,OpenGraphProtocol协议解析模块,textract,从任何文件,Word,PowerPoint,PDF文件中提取文本,等。

sanitize,消毒,使混乱的数据变的理智。

AutobahnPython,WebSocket和WAMP的函数库,使用Twisted和PythonWebSocket-for-Python,websocket客户端和服务器端函数库。SimpleXMLRPCServer,python标准库,简单的XML-RPC服务器,单线程。

SimpleJSONRPCServer,JSON-RPC规范实施函数库。

zeroRPC,基于ZeroMQ和MessagePack的RPC实现。

apache-libcloud,所有云服务的Python接口库。

wifi,WiFi-一套个Python库和命令行工具与WiFi,用于[Linux]。

streamparse,运行Python代码和数据的实时流。集成了ApacheStorm。

boto,亚马逊网络服务接口。

twython,Twitter推特API。google-api-python-client,谷歌客户端API。

gspread,谷歌电子表格的PythonAPI。

facebook-sdk,facebook平台PythonSDK。

facepy,简易的facebook图形APIgmail,Gmail的Python接口。

django-wordpress,Django的WordPress的模型和视图。

Django,最流行的Python-Web框架,鼓励快速开发,并遵循MVC设计,开发周期短

ActiveGrid企业级的Web2.0解决方案

Karrigell简单的Web框架,自身包含了Web服务,py脚本引擎和纯python的数据库PyDBLitewebpy一个小巧灵活的Web框架,虽然简单但是功能强大

CherryPy基于Python的Web应用程序开发框架Pylons基于Python的一个极其高效和可靠的Web开发框架Zope开源的Web应用服务器

TurboGears基于Python的MVC风格的Web应用程序框架

Twisted流行的网络编程库,大型Web框架

QuixoteWeb开发框架

Flask轻量级web框架

Bottle,快速,简单和轻量级的WSGI模式Web框架。

Pyramid,轻量级,快速,稳定的开源Web框架。

web2py,简单易用的全堆栈Web框架和平台。

web.py,强大、简单的Web框架。TurboGears,便于扩展的Web框架。

CherryPy,极简PythonWeb框架,支持,HTTP1.1和WSGI线程池。

Grok,基于Zope3的Web框架。

Bluebream,开源的Web应用服务器,原名Zope3。

guava,轻量级,高性能的Python-Web框架,采用c语言编写。

django-cms,基于Django企业级开源CMS。

djedi-cms轻量级但功能强大的DjangoCMS的插件,内联编辑和性能优化。

FeinCMS,基于Django的先进内容管理系统。

Kotte,高层次的Python的Web应用框架,基于Pyramid。Mezzanine,强大,一致,灵活的内容管理平台。

Opps,基于Django的CMS,用于高流量的报纸、杂志和门户网站。

Plone,基于Zope的开源应用服务器Zope。

Quokka,灵活,可扩展的,轻量级的CMS系统,使用Flask和MongoDB。

Wagtail,Django内容管理系统。

Widgy,CMS框架,基于Django。

django-oscar,Django奥斯卡,开源的电子商务框架。

django-shop,基于Django的网店系统。

merchant,支持多种付款处理工具。

money,可扩展的货币兑换解决方案。

python-currencies,货币显示格式。

cornice,Pyramid的REST框架。

django-rest-framework,Django框架,强大灵活的工具,可以很容易地构建WebAPI。

django-tastypie,创造精美的Django应用程序API接口。

django-formapi,创建JSONAPI、HMAC认证和Django表单验证。flask-api,提供统一的浏览器体验,基于Django框架。

flask-restful,快速构建RESTAPI支持扩展。

flask-api-utils,flask的扩展。falcon,猎鹰,高性能的Python框架,构建云API和Web应用程序后端。

eve,夏娃,RESTAPI框架,使用Flask,MongoDB和良好意愿。

sandman,睡魔,为现有的数据库驱动的系统,自动生成RESTAPI。restless,类似TastyPie的框架。

savory-pie,RESTAPI构建函数库(Django,及其他)Jinja2,现代设计师友好的语言模板。Genshi,网络感知输出模板工具包。

Mako,马可,Python平台的超高速、轻型模板。

Chameleon,变色龙,一个HTML/XML模板引擎。

仿照ZPT,优化速度。

Spitfire,快速的Python编译模板。

django-haystack,大海捞针,Django模块搜索。

elasticsearch-py,Elasticsearch官方低级的Python客户端。

solrpy,solr客户端。

Whoosh,呼,快速,纯Python搜索引擎库。

Feedly,建立新闻和通知系统的函数库,使用Cassandra和Redis。

django-activity-stream,Django活动流,从你网站上的行动,产生通用的活动流。

Beaker,烧杯,一个缓存和会话使用的Web应用程序,独立的Python脚本和应用程序库。

dogpile.cache,是Beaker作者的下一代替代作品。HermesCache,Python的缓存库,基于标签的失效及预防Dogpile效果。

django-cache-machine,Django缓存机,自动缓存失效,使用ORM。django-cacheops,自动颗粒事件驱动,ORM缓存失效。johnny-cache,约翰尼高速缓存框架,Django应用程序。

django-viewlet,渲染模板部件扩展缓存控制。pylibmc,在libmemcached接口。

W。TForms-JSON,JSON表单数据处理扩展。Deform,HTML表单生成的函数库。

django-bootstrap3,bootstrap3,集成了Django。django-crispy-forms,Django程序,可以创建优雅的表单。django-remote-forms,Django的远程表单,Django表格的序列化程序。

django-simple-spam-blocker,Django简单的垃圾邮件拦截器。

django-simple-captcha,Django简单验证码,简单的和高度可定制的Django应用程序,用于添加验证码图像Ajenti,服务器管理面板。

Grappelli,界面花哨的django皮肤。django-suit,Django替代o界面(仅用于非商业用途)。django-xadmin,Django管理面板替代工具。

flask-admin,简单的flask管理界面框架flower,实时监控和Web管理面板。

Pelican,鹈鹕,Markdown或ReST,字王内容主题。支持DVCS,Disqus.AGPL。Cactus,仙人掌,设计师的网站静态生成器。

Hyde,海德,基于Jinja2的静态网站生成器。

Nikola,尼古拉-一个静态网站和博客生成器。

Tags,标签,最简单的静态网站生成器。

Tinkerer,工匠,基于Sphinx的静态网站生成器。

asyncio,(在Python3.4是Python标准库),异步I/O,事件循环,协同任务。gevent,基于Python的网络库。

Twisted,扭曲,事件驱动的网络引擎。

Tornado,龙卷风,Web框架和异步网络的函数库。

pulsar,脉冲星,事件驱动的并行框架的Python。

diesel,柴油,绿色的,基于事件的I/O框架。

eventlet,WSGI支持异步框架。

pyzmq,0MQ消息库的Python封装。

txZMQ,基于Twisted的0MQ消息库封Crossbar,开源统一应用路由器(WebSocket和WAMP)。wsgiref,Python标准库,WSGI封装实现,单线程。

Werkzeug,机床,WSGI工具函数库,很容易地嵌入到你自己的项目框架。

paste,粘贴,多线程,稳定的,久经考验的WSGI工具。

rocket,火箭,多线程服务,基于Pyramid。

netius,快速的、异步WSGI服务器,gunicorn,forked前身,部分用C写的。

fapws3,异步网络,用C写的。meinheld,异步WSGI服务器,是用C写的。

bjoern,-快速的、异步WSGI服务器,用C写的。

Permissions函数库,允许或拒绝用户访问数据或函数。

django-guardian,Django守护者,管理每个对象的权限,用于Django1.2Carteblanche,管理导航和权限。

OAuthLib,通用,规范,OAuth请求签约工具。

rauth,用于OAuth1.0,2.0,的Python库。

python-oauth2,利用全面测试,抽象接口来创建OAuth的客户端和服务器。

python-social-auth,易于安装的社会认证机制。

,django-oauth-toolkit,DjangoOAuth工具包django-oauth2-provider,DjangoOAuth2工具包。django-allauth,Django认证的应用程序。

Flask-OAuthlib,Flask的OAuth工具包sanction,制裁,简单的oauth2客户端。

jose,[JavaScript]对象签名和加密(JOSE)草案实施,标记状态。

python-jwt,JSON的Web令牌生成和验证模块。

pyjwt,JSON的Web令牌草案01。

python-jws,JSON的Web令牌草案02。

PyCrypto,Python的加密工具包。

Paramiko,sshv2协议的实现,提供了客户端和服务器端的功能。

cryptography,密码开发工具包。

PyNac,网络和密码(NaCl)函数库。hashids,hashids的Python函数库。

Passlib,安全的密码存储/哈希库,非常高的水平。

hashlib,md5,sha等hash算法,用来替换md5和sha模块,并使他们的API一致。

它由OpenSSL支持,支持如下算法:md5,sha1,sha224,sha256,sha384,sha512.

PyGtk,基于Python的GUI程序开发GTK库

PyQt用于Python的QT开发库

TkinterPython下标准的界面编程包,因此不算是第三方库了

PySide,跨平台Qt的应用程序和用户界面框架,支撑Qtv4框架。

wxPython,混合wxWidgets的C类库。

kivy,创建应用程序GUI函数库,看运行于Windows,Linux,MACOSX,Android和iOS

curse,用于创建终端GUI应用程序。

urwid,创建终端GUI应用程序窗体的函数库,支持事件,色彩丰富。

pyglet,跨平台的窗口和多媒体库的Python。

Tkinter,是Python事实上的标准GUI软件包。

enaml,创建漂亮的用户界面,语法类似QML。

Toga,托加,OS原生GUI工具包。

pyenv,简单的Python版本管理。

virtualenv,创建独立的Python环境,用于同时安装不同版本的python环境。

virtualenvwrapper,是virtualenv的一组扩展。

pew,一套管理多个虚拟环境的工具。

vex,使运行指定的virtualenv命令。

PyRun,一个单文件,无需安装的Python版本管理工具。

PIP,Python包和依赖的管理工具。

easy_install,软件包管理系统,提供一个标准的分配Python软件和函式库的格式。是一个附带设置工具的模块,和一个第三方函式库。旨在加快Python函式库的分配程式的速度。类似Ruby语言的RubyGems。

conda,跨平台,二进制软件包管理器。

Curdling,一个管理Python包的命令行工具。

wheel,Python发行的新标准,旨在替代eggs.

cx-Freeze,跨平台的,用于打包成可执行文件的库

py2exe,Windows平台的Freeze脚本工具,Py2exe,将python脚本转换为windows上可以独立运行的可执行程序

py2app,MACOSX平台的Freeze脚本工具

pyinstaller,-转换成独立的可执行文件的Python程序(跨平台)。

pynsist,构建Windows安装程序的工具,用Python编写。

dh-virtualenv,建立和分发virtualenv(Debian软件包格式)

PyPI,新一代的Python包库管理工具。

warehouse,新一代的Python包库(PyPI)管理工具。

devpi,PyPI服务器和包装/测试/发布工具。

localshop,PyPI官方包镜像服务器,支持本地(私人)包上传。

buildout,创建,组装和部署应用程序的多个部分,其中一些可能是非基于Python的。SCons,软件构造工具。

platformio,一个控制台的工具,构建的代码可用于不同的开发平台。

bitbake,特殊设计的工具,用于创建和部署[嵌入式]Linux软件包

fabricate,自动为任何编程语言,生成依赖包。

django-compressor,Django压缩机,压缩和内联JavaScript或CSS,链接到一个单一的缓存文件。jinja-assets-compressor,金贾压缩机,一个Jinja扩展,通过编译,压缩你的资源。

webassets,优化管理,静态资源,独特的缓存清除。

fanstatic,球迷,包优化,提供静态文件。

fileconveyor,监控资源变化,,可保存到CDN(内容分发网络)和文件系统。

django-storages,一组自定义存储Django后台。

glue,胶胶,一个简单的命令行工具,生成CSSSprites。

libsass-python,Sass(层叠样式表)的Python接口。

Flask-Assets,整合应用程序资源。

unittest,Python标准库,单元测试框架。

nose,鼻子,unittest延伸产品。

pytest,成熟的全功能的Python测试工具。

mamba,曼巴,Python的权威测试工具。出自BDD的旗下。

contexts,背景,BDD测试框架,基于C#。

pyshould,should风格的测试框架,基于PyHamcrest.

pyvows,BDD风格测试框架

Selenium,web测试框架,Python绑定Selenium。

splinter,分裂,测试Web应用程序的开源工具。

locust,刺槐,可扩展的用户负载测试工具,用Python写的。

sixpack,语言无关的A/B测试框架。

mock,模拟对象(英语:mockobject,也译作模仿对象),模拟测试库。

responses,工具函数,用于mock模拟测试。

doublex-强大的测试框架。

httmock,mock模拟测试。

coverage,代码覆盖度量测试。

faker,生成模拟测试数据的Python包。

mixer,混频器,产生模拟数据,用于DjangoORM,SQLAlchemy,Peewee,MongoEngine,PonyORM等

model_mommy,在Django创建测试随机工具。

ForgeryPy,易用的模拟数据发生器。

F。uckIt.py,测试Python代码运行。

CodeAnalysispysonar2,Python类型索引。

pycallgraph,可视化的流量(调用图)应用程序。

code2flow,转换Python和JavaScript代码到流程图。

LinterFlake8,源代码模块检查器

pylama,Python和JavaScript代码审计工具。

Pylint,源代码分析器,它查找编程错误,帮助执行一个代码标准和嗅探一些代码味道。注意:相比于PyChecker,Pylint是一个高阶的Python代码分析工具,它分析Python代码中的错误。

Pyflakes,一个用于检查Python源文件错误的简单程序。Pyflakes分析程序并且检查各种错误。它通过解析源文件实现,无需导入。

pdb,Python标准库,Python调试器。

ipdb,IPython使用的PDB。

winpdb独立于平台的GUI调试器。

pudb,全屏,基于python调试控制台。

pyringe,-可附着于及注入代码到Python程序的调试器。

python-statsd,statsd服务器客户端。

memory_profiler,内存监视。

profiling,交互式Python分析器。

django-debug-toolbar,Django调试工具栏,显示各种调试信息:当前请求/响应。

THE END
1.python大数据比赛程序mob649e81664bd9的技术博客python大数据比赛程序 Python在大数据比赛中的应用 在如今这个信息爆炸的时代,数据的收集、分析与处理已经成为各行各业的热门话题。尤其是在大数据比赛中,参与者面临着巨大的挑战,他们需要有效地处理和分析海量的数据,以寻找有价值的信息。因此,掌握Python及其数据处理库成为了参赛者的基本要求。本文将探讨Python在大数据https://blog.51cto.com/u_16175508/12834992
2.Python数据平台:大数据处理系统大数据(Big Data)是指传统数据处理工具不足以处理的规模巨大、结构多样和来源广泛的数据集合。大数据处理系统能够处理这些数据,并从中提取价值。 二、Python与大数据处理 在大数据处理中的应用 在大数据处理领域有着丰富的应用场景,包括数据采集、清洗、处理、分析和可视化等各个环节。 https://www.jianshu.com/p/c063c3205d6f
3.Python数据清洗的10个关键步骤,专业数据分析必看Python数据清洗的10个关键步骤,专业数据分析必看 在数据分析领域,数据清洗是至关重要的一步,它直接影响到分析结果的准确性和可靠性。今天,我要分享10个关键的Python数据清洗步骤,这些步骤能够帮助我们从原始数据中提取有用信息,为后续的数据分析打下坚实的基础。无论你是数据分析的新手还是专业人士,这些步骤都是https://baijiahao.baidu.com/s?id=1818740474196213418&wfr=spider&for=pc
4.Python中高效处理大数据的几种方法python处理大量数据随着数据量的爆炸性增长,如何在Python中高效地处理大数据成为了许多开发者和数据科学家的关注焦点。Python以其简洁的语法和丰富的库支持,在数据处理领域占据了重要地位。本文将介绍几种在Python中高效处理大数据的常用方法。 目录 1. 使用Pandas进行数据分析 https://blog.csdn.net/qq_33502371/article/details/140540554
5.Python数据分析——数据运算python数据分析——数据运算 pandas中具有大量的数据计算函数,比如求计数、求和、求平均值、求最大值、最小值、中位数、众数、方差、标准差等。 一、非空值计数 【例】对于存储在该Python文件同目录下的某电商平台销售数据product_sales.csv,形式如下所示,请利用Python对数据读取,并计算数据集每列非空值个数情况。https://open.alipay.com/portal/forum/post/161301018
6.中国开发者真实现状:40岁不做开发,算法工程师最稀缺R 被广泛应用,也和数据相关,在数据规模不大的前提下对专业或非开发的人员都十分的友好。此外,Python 依然是最期望被学习的语言,这毫无疑问和人工智能被高度关注有密切联系,使得 Python 成为机器学习必修课。 02.大数据应用场景仍呈现单一化,数据挖掘或成后续主流https://36kr.com/p/1723305279489
7.年薪50万!北航合肥创新研究院招募研究员!澎湃号·政务4、了解CV、机器学习、深度学习或强化学习、大数据分析等常用算法及模型,具备较强的编程能力,熟悉Tensorflow等机器学习平台; 5、有重大基础研究和应用研究经验者以及具备产学研合作和科技成果转化经验者优先; 6、能紧跟自身科研领域的发展方向,具有较强的团结协作、拼搏奉献精神,能够协助团队负责人开展科研管理工作。 https://www.thepaper.cn/newsDetail_forward_4985535
8.如何做年薪30万的Python算法工程师?如何做年薪30万的Python算法工程师? 数据分析师发展会有几个层次,初级数据分析师,也称数据分析员,一般被称为“表哥、表妹、表姐、表弟”,以图表展现统计工作为主。中级数据分析师会涉及到一些需要掌握概率论和统计理论基础,利用分析方法进行数据的处理与分析。到了中高级的数据分析师,就会涉及到一些关键指标的设定,https://www.cda.cn/dt/18152.html
9.概率统计学在机器学习中应用:20个Python示例算法贝叶斯pythonspide大数据文摘受权转载自机器学习算法与Python实战 在数据科学和机器学习领域,概率论和统计学扮演着至关重要的角色。Python作为一种强大而灵活的编程语言,提供了丰富的库和工具来实现这些概念。本文将通过20个Python实例,展示如何在实际应用中运用概率论和统计学知识。 https://dy.163.com/article/JC7B8F1Q0511831M.html
10.Python金融大数据分析第2版《Python金融大数据分析 第2版》分为5部分,共21章。第1部分介绍了Python在金融学中的应用,其内容涵盖了Python用于金融行业的原因、Python的基础架构和工具,以及Python在计量金融学中的一些具体入门实例;第2部分介绍了Python的基础知识以及Python中非常有名的库NumPy和pandas工具集,还介绍了面向对象编程;第3部分介绍金融https://labs.epubit.com/bookDetails?id=UB6c965dace7319
11.股票期货量化交易python金融大数据分析量化投资算法量化交易基本图书 > 计算机与互联网 > 编程语言与程序设计 > 中国水利水电出版社 > Python量化交易实战从入门到精通 深入浅出python股票期货量化交易python金融大数据分析量化投资 算法量化交易基本面策略量化交易软件拆解 量化投资的黑箱量化炒股 自营 中国水利水电出版社京东自营官方旗舰店 https://item.jd.com/13301055.html
12.软件工程专业培养方案(2022)围绕区域经济发展需求,有机结合学校交通、电力、水利行业特色,主动适应国家、地方与行业发展结构调整、转型升级对软件工程人才的需要,培养社会责任感强、专业知识扎实、国际视野良好、创新精神和实践能力突出的高素质复合型工程人才,把专业建设成为特色鲜明的国内一流专业。 https://www.csust.edu.cn/jtxy/info/1302/20908.htm
13.python学习大数据与科学计算第三方库简介菜鸟传奇大数据与科学计算 库名称 简介 pycuda/opencl GPU高性能并发计算 Pandas python实现的类似R语言的数据统计、分析平台。基于NumPy和Matplotlib开发的,主要用于数据分析和数据可视化,它的数据结构DataFrame和R语言里的data.frame很像,特别是对于时https://www.cnblogs.com/cainiao-chuanqi/p/11383792.html
14.Python金融大数据分析(第2版)(豆瓣)Python已成为数据驱动AI、金融优先选择的编程语言。现在,一些大型的投资银行和对冲资金均使用Python及其生态系统来构建核心交易与风险管理系统。在本书中,作者向开发人员和量化分析人员介绍了使用Python程序库与工具,完成金融数据科学、算法交易和计算金融任务的方法。 https://book.douban.com/subject/35016263/
15.零起点Python足彩大数据与机器学习实盘分析完整pdf扫描版[122MB]电《零起点Python足彩大数据与机器学习实盘分析》采用Python编程语言、Pandas数据分析模块、机器学习和人工智能算法,对足彩大数据进行实盘分析。设计并发布了开源大数据项目zc-dat足彩数据包,汇总了2010—2016年全球5万余场足球比赛的赛事和赔率数据,包括威廉希尔、澳门、立博、Bet365、Interwetten、SNAI、皇冠、易胜博、伟德、https://www.jb51.net/books/637110.html
16.数据挖掘论文的参考文献绝大读书数据挖掘岗位都是做应用,数据清洗,用现成的库建模,如果你自己不往算法或者架构方面继续提升,和其他的开发岗位的性质基本没什么不同,只要会编程都是很容易入门的。 2.北上广以外的普通公司用的多吗?待遇如何? 实际情况不太清楚,由于数据挖掘和大数据这个概念太火了,肯定到处都有人招聘响应的岗位,但是二线城https://www.yjbys.com/bylw/cankaowenxian/76866.html
17.python机器学习chatgpt聊天机器人深度学习大数据处理数据数学教科书区块链教科书Python算法入门Numpy数据处理Pandas数据预处理Python科学计算Python深度学习TensorFlow开发入门Python自然语言处理Python数据分析R数据科学IT用语图鉴 加入购物车 中国水利水电出版社当当自营 进入店铺收藏店铺 开本:32开 纸张:胶版纸 包装:平装-胶订 http://product.dangdang.com/29316742.html
18.大数据全栈式开发语言–PythonPython软件编程前段时间,ThoughtWorks 在深圳举办一次社区活动上,有一个演讲主题叫做“Fullstack JavaScript”,是关于用 JavaScript 进行前端、服务器端,甚至数据库(MongoDB)开发,一个 Web 应用开发人员,只需要学会一门语言,就可以实现整个应用。 受此启发,我发现 Python 可以称为大数据全栈式开发语言。因为 Python 在云基础设施,Devhttps://www.open-open.com/news/view/13f5218
19.Python数据分析笔记:聚类算法之K均值腾讯云开发者社区Python数据分析笔记:聚类算法之K均值 我们之前接触的所有机器学习算法都有一个共同特点,那就是分类器会接受2个向量:一个是训练样本的特征向量X,一个是样本实际所属的类型向量Y。由于训练数据必须指定其真实分类结果,因此这种机器学习统称为有监督学习。 然而有时候,我们只有训练样本的特征,而对其类型一无所知。这种https://cloud.tencent.com/developer/article/1058425
20.科学网—GEE入门学习,遥感云大数据分析管理与可视化以及在林业1.以一个完整的土地利用分类案例来回顾GEE的主要功能。包含不同地面样本准备、多源遥感影像预处理、算法开发、分类后处理、精度评估和空间统计分析与制图等环节 2.征集案例讲解与答疑 3.GEE代码优化、常见错误与调试总结 GPT模型支持下的Python-GEE遥感云大数据分析、管理与可视化技术及多领域案例实践应用 https://wap.sciencenet.cn/blog-3539141-1395081.html