机器学习是当今的热门话题之一。Python是众多用户中排名第一的编程语言。然而,Python是一种通用编程语言,这意味着它被用于许多不同的领域。要使用Python进行机器学习,除了通用Python之外,您还需要学习一些额外的Python库。
在这篇文章中,我将讨论的概况牛逼,他最根本的Python库,将帮助你开始你的机器学习之旅。我强烈建议您尽可能熟悉它们,因为它们是基础知识。如果没有正确学习它们,您将在学习之旅中途放弃!
1.NumPy
NumPy是许多其他基于NumPy的库的母库。NumPy的代表民ericalPY马拉松。所述ndarray(N维阵列)对象是在NumPy的主数据结构。在机器学习中,我们经常使用向量(一维数组)和矩阵(二维数组)。NumPy提供了创建这些数组的简单方法。在处理图像数据时,我们处理NumPy3D数组。NumPy还提供了大量的数学函数,尤其是线性代数。
资源
官方网站
文档
安装
默认情况下,NumPy带有Anaconda安装程序。如果您已经通过Anaconda安装了Python,则无需再次安装NumPy。但是,有两种安装NumPy的方法。
conda安装
condainstall-canacondanumpy#ORcondainstall-cconda-forgenumpy
pip安装
pipinstallnumpy
导入约定
社区接受的NumPy导入约定是:
importnumpyasnp
2.Pandas
Pandas是Python数据操作和分析库。它建立在NumPy之上,这意味着它支持NumPyN维数组。Pandas如此受欢迎,以至于它的下载总数可以代表整个数据科学社区!Pandas提供了数据加载、数据清理、变量编码、数据转换等方法。Pandas还提供了绘图功能,因为它集成了各种绘图库。Series和DataFrame是Pandas中的两种主要数据结构。PandasSeries可以用一维NumPy数组创建,而PandasDataFrames可以用二维NumPy数组创建,因为Pandas是建立在NumPy之上的。
资源
官方网站
文档
安装
默认情况下,Pandas带有Anaconda安装程序。如果您已经通过Anaconda安装了Python,则无需再次安装Pandas。但是,有两种安装Pandas的方法。
conda安装
condainstall-canacondapandas#ORcondainstall-cconda-forgepandas
pip安装
pipinstallpandas
导入约定
社区接受的Pandas导入约定是:
importpandasaspd
3.Matplotlib
Matplotlib是Python中的基本绘图库。但是,它为您的绘图提供了大量自定义选项。它也是其他高级绘图库的母库。该库有两种不同的应用程序编程接口(API)——Pyplot接口和面向对象的接口。
资源
官方网站
文档
安装
默认情况下,Matplotlib带有Anaconda安装程序。如果您已经通过Anaconda安装了Python,则无需再次安装Matplotlib。但是,有两种安装Matplotlib的方法。
conda安装
condainstall-cconda-forgematplotlib
pip安装
pipinstallmatplotlib
导入约定
社区接受的Matplotlib导入约定是:
importmatplotlib.pyplotasplt
4.Seaborn
Seaborn是一个高级数据可视化库,这意味着它会自动为我们做很多事情!它还为您的情节提供了很多美感。您可以使用Matplotlib自定义seaborn。
资源
官方网站
文档
安装
默认情况下,Seaborn带有Anaconda安装程序。如果您已经通过Anaconda安装了Python,则无需再次安装Seaborn。但是,有两种安装Seaborn的方法。
conda安装
condainstall-canacondaseaborn
pip安装
pipinstallseaborn
导入约定
Seaborn的社区接受的导入约定是:
importseabornassns
5.Scikit-learn
Scikit-learn是一个Python机器学习库。它的语法非常一致,即使对于初学者来说,通过创建一两个模型也很容易熟悉整个库。它的官方文档提供了使用这个库所需的所有支持。它包括用于分类、回归、聚类、降维模型的算法。它还提供了用于数据预处理的高级方法。
资源
官方网站
文档
安装
默认情况下,Scikit-learn附带Anaconda安装程序。如果您已经通过Anaconda安装了Python,则无需再次安装Scikit-learn。但是,有两种安装Scikit-learn的方法。
conda安装
condainstall-canacondascikit-learn#ORcondainstall-cconda-forgescikit-learn
pip安装
pipinstallscikit-learn
导入约定
我们不会一次导入整个库。相反,我们根据需要导入类和函数。
6.Yellowbrick
Yellowbrick是一个机器学习可视化库。顾名思义,它适用于机器学习相关的可视化。语法与Scikit-learn库非常相似。使用Yellowbrick,您只需一两行代码即可创建高级绘图!
资源
官方网站和文档
安装
默认情况下,Yellowbrick不附带Anaconda安装程序。因此,您需要单独安装它。有两种方法。
conda安装
condainstall-cdistrictdatalabsyellowbrick
pip安装
pipinstallyellowbrick
导入约定
与Scikit-learn一样,我们不会一次导入整个库。相反,我们根据需要导入类和函数。
7.XGBoost
当我们考虑机器学习模型的性能时,XGBoost(ExtremeGradientBoosting)是数据科学家和机器学习工程师最喜欢的机器学习算法。XGBoost(这次是库)可用于许多编程语言,包括Python。XGBoost的Scikit-learn包装器(Scikit-learn兼容API)最近发布,以便我们可以像Scikit-learn一样使用XGBoost。还有一个用于XGBoost的非Scikit-learn兼容API。但是,与XGBoost的Scikit-learn包装器相比,它很难使用。因此,我建议您首先使用XGBoost的Scikit-learn包装器,然后转到非Scikit-learn版本(如果需要)。
资源
官方网站和文档
安装
默认情况下,XGBoost不附带Anaconda安装程序。因此,您需要使用以下代码单独安装它。
condainstall-canacondapy-xgboost#Windowscondainstall-cconda-forgexgboost#MacOSorLinux
导入
社区接受的XGBoost导入约定是:
importxgboostasxgb
8.TensorFlow
TensorFlow是为深度学习任务创建的深度学习库。深度学习是机器学习的一个子集。TensorFlow也可用于一般机器学习。它有两个API——高级API和低级API。它的主要数据结构是Tensor。
资源
官方网站和文档
安装
默认情况下,TensorFlow不附带
conda安装
condainstall-cconda-forgetensorflow#CPU-only
pip安装
pipinstalltensorflow#BothCPUandGPUsupport
导入约定
社区接受的TensorFlow导入约定是:
importtensorflowastf
我们应该按照什么顺序学习这些库?
按照上面的顺序!只需从NumPy基础知识和数组创建方法开始。然后执行NumPy数组索引和切片。熟悉它们后,转到Pandas基础-创建系列和数据帧。现在,您可以进行并行学习——NumPy和Pandas。在这个阶段,熟悉NumPy算术和线性代数运算以及Pandas高级理论——子集、数据清洗、变量编码、数据转换等。然后,进入Matplotlib和Seaborn。只需从Matplotlib开始。我的建议是您使用Pandas绘图函数进行基本的可视化。如果您需要更多自定义,请选择Matplotlib。对于高级可视化,请使用seaborn。
现在,是时候学习Scikit-learn了。现在,这将很容易,因为您熟悉NumPy和Pandas。当您熟悉Scikit-learn时,您可以使用Yellowbrick进行机器学习可视化。然后去学习TensorFlow和深度学习部分。通过这样做,你会在学习的过程中永不放弃!这些方法对你有用吗?
在评论区让我知道。谢谢阅读!下次见,祝大家学习愉快!