数据结构论坛

首页 » 分类 » 定义 » 技术分享开启机器学习之旅的8个推荐P
TUhjnbcbe - 2023/6/26 22:02:00

机器学习是当今的热门话题之一。Python是众多用户中排名第一的编程语言。然而,Python是一种通用编程语言,这意味着它被用于许多不同的领域。要使用Python进行机器学习,除了通用Python之外,您还需要学习一些额外的Python库。

在这篇文章中,我将讨论的概况牛逼,他最根本的Python库,将帮助你开始你的机器学习之旅。我强烈建议您尽可能熟悉它们,因为它们是基础知识。如果没有正确学习它们,您将在学习之旅中途放弃!

1.NumPy

NumPy是许多其他基于NumPy的库的母库。NumPy的代表民ericalPY马拉松。所述ndarray(N维阵列)对象是在NumPy的主数据结构。在机器学习中,我们经常使用向量(一维数组)和矩阵(二维数组)。NumPy提供了创建这些数组的简单方法。在处理图像数据时,我们处理NumPy3D数组。NumPy还提供了大量的数学函数,尤其是线性代数。

资源

官方网站

文档

安装

默认情况下,NumPy带有Anaconda安装程序。如果您已经通过Anaconda安装了Python,则无需再次安装NumPy。但是,有两种安装NumPy的方法。

conda安装

condainstall-canacondanumpy#ORcondainstall-cconda-forgenumpy

pip安装

pipinstallnumpy

导入约定

社区接受的NumPy导入约定是:

importnumpyasnp

2.Pandas

Pandas是Python数据操作和分析库。它建立在NumPy之上,这意味着它支持NumPyN维数组。Pandas如此受欢迎,以至于它的下载总数可以代表整个数据科学社区!Pandas提供了数据加载、数据清理、变量编码、数据转换等方法。Pandas还提供了绘图功能,因为它集成了各种绘图库。Series和DataFrame是Pandas中的两种主要数据结构。PandasSeries可以用一维NumPy数组创建,而PandasDataFrames可以用二维NumPy数组创建,因为Pandas是建立在NumPy之上的。

资源

官方网站

文档

安装

默认情况下,Pandas带有Anaconda安装程序。如果您已经通过Anaconda安装了Python,则无需再次安装Pandas。但是,有两种安装Pandas的方法。

conda安装

condainstall-canacondapandas#ORcondainstall-cconda-forgepandas

pip安装

pipinstallpandas

导入约定

社区接受的Pandas导入约定是:

importpandasaspd

3.Matplotlib

Matplotlib是Python中的基本绘图库。但是,它为您的绘图提供了大量自定义选项。它也是其他高级绘图库的母库。该库有两种不同的应用程序编程接口(API)——Pyplot接口和面向对象的接口。

资源

官方网站

文档

安装

默认情况下,Matplotlib带有Anaconda安装程序。如果您已经通过Anaconda安装了Python,则无需再次安装Matplotlib。但是,有两种安装Matplotlib的方法。

conda安装

condainstall-cconda-forgematplotlib

pip安装

pipinstallmatplotlib

导入约定

社区接受的Matplotlib导入约定是:

importmatplotlib.pyplotasplt

4.Seaborn

Seaborn是一个高级数据可视化库,这意味着它会自动为我们做很多事情!它还为您的情节提供了很多美感。您可以使用Matplotlib自定义seaborn。

资源

官方网站

文档

安装

默认情况下,Seaborn带有Anaconda安装程序。如果您已经通过Anaconda安装了Python,则无需再次安装Seaborn。但是,有两种安装Seaborn的方法。

conda安装

condainstall-canacondaseaborn

pip安装

pipinstallseaborn

导入约定

Seaborn的社区接受的导入约定是:

importseabornassns

5.Scikit-learn

Scikit-learn是一个Python机器学习库。它的语法非常一致,即使对于初学者来说,通过创建一两个模型也很容易熟悉整个库。它的官方文档提供了使用这个库所需的所有支持。它包括用于分类、回归、聚类、降维模型的算法。它还提供了用于数据预处理的高级方法。

资源

官方网站

文档

安装

默认情况下,Scikit-learn附带Anaconda安装程序。如果您已经通过Anaconda安装了Python,则无需再次安装Scikit-learn。但是,有两种安装Scikit-learn的方法。

conda安装

condainstall-canacondascikit-learn#ORcondainstall-cconda-forgescikit-learn

pip安装

pipinstallscikit-learn

导入约定

我们不会一次导入整个库。相反,我们根据需要导入类和函数。

6.Yellowbrick

Yellowbrick是一个机器学习可视化库。顾名思义,它适用于机器学习相关的可视化。语法与Scikit-learn库非常相似。使用Yellowbrick,您只需一两行代码即可创建高级绘图!

资源

官方网站和文档

安装

默认情况下,Yellowbrick不附带Anaconda安装程序。因此,您需要单独安装它。有两种方法。

conda安装

condainstall-cdistrictdatalabsyellowbrick

pip安装

pipinstallyellowbrick

导入约定

与Scikit-learn一样,我们不会一次导入整个库。相反,我们根据需要导入类和函数。

7.XGBoost

当我们考虑机器学习模型的性能时,XGBoost(ExtremeGradientBoosting)是数据科学家和机器学习工程师最喜欢的机器学习算法。XGBoost(这次是库)可用于许多编程语言,包括Python。XGBoost的Scikit-learn包装器(Scikit-learn兼容API)最近发布,以便我们可以像Scikit-learn一样使用XGBoost。还有一个用于XGBoost的非Scikit-learn兼容API。但是,与XGBoost的Scikit-learn包装器相比,它很难使用。因此,我建议您首先使用XGBoost的Scikit-learn包装器,然后转到非Scikit-learn版本(如果需要)。

资源

官方网站和文档

安装

默认情况下,XGBoost不附带Anaconda安装程序。因此,您需要使用以下代码单独安装它。

condainstall-canacondapy-xgboost#Windowscondainstall-cconda-forgexgboost#MacOSorLinux

导入

社区接受的XGBoost导入约定是:

importxgboostasxgb

8.TensorFlow

TensorFlow是为深度学习任务创建的深度学习库。深度学习是机器学习的一个子集。TensorFlow也可用于一般机器学习。它有两个API——高级API和低级API。它的主要数据结构是Tensor。

资源

官方网站和文档

安装

默认情况下,TensorFlow不附带

conda安装

condainstall-cconda-forgetensorflow#CPU-only

pip安装

pipinstalltensorflow#BothCPUandGPUsupport

导入约定

社区接受的TensorFlow导入约定是:

importtensorflowastf

我们应该按照什么顺序学习这些库?

按照上面的顺序!只需从NumPy基础知识和数组创建方法开始。然后执行NumPy数组索引和切片。熟悉它们后,转到Pandas基础-创建系列和数据帧。现在,您可以进行并行学习——NumPy和Pandas。在这个阶段,熟悉NumPy算术和线性代数运算以及Pandas高级理论——子集、数据清洗、变量编码、数据转换等。然后,进入Matplotlib和Seaborn。只需从Matplotlib开始。我的建议是您使用Pandas绘图函数进行基本的可视化。如果您需要更多自定义,请选择Matplotlib。对于高级可视化,请使用seaborn。

现在,是时候学习Scikit-learn了。现在,这将很容易,因为您熟悉NumPy和Pandas。当您熟悉Scikit-learn时,您可以使用Yellowbrick进行机器学习可视化。然后去学习TensorFlow和深度学习部分。通过这样做,你会在学习的过程中永不放弃!这些方法对你有用吗?

在评论区让我知道。谢谢阅读!下次见,祝大家学习愉快!

1
查看完整版本: 技术分享开启机器学习之旅的8个推荐P