python生成器處理大數(shù)據(jù) python用法？

2023-06-05

2691

python用法？一.變量類型1.變量賦值Python中的變量賦值不需要類型聲明。每個變量在使用前都必須賦值，在賦值前不會被創(chuàng)建。使用等號給變量賦值。2.多個變量的賦值當(dāng)給多個變量賦值或在列表中交換數(shù)

python用法？

一.變量類型

1.變量賦值

Python中的變量賦值不需要類型聲明。每個變量在使用前都必須賦值，在賦值前不會被創(chuàng)建。使用等號給變量賦值。

2.多個變量的賦值

當(dāng)給多個變量賦值或在列表中交換數(shù)據(jù)時，可以使用這種賦值方法。

3.標(biāo)準(zhǔn)數(shù)據(jù)類型

內(nèi)存中存儲著多種類型的數(shù)據(jù)。Python定義了一些標(biāo)準(zhǔn)類型來存儲各種類型的數(shù)據(jù)。下面列出了幾種數(shù)據(jù)類型:

一，數(shù)字

數(shù)字?jǐn)?shù)據(jù)類型用于存儲數(shù)值，數(shù)字?jǐn)?shù)據(jù)類型是不可變的數(shù)據(jù)類型。Python支持三種不同的數(shù)字類型:

Int:通常稱為integer，沒有小數(shù)，正整數(shù)和負整數(shù)都可以。注意python3沒有python2 s長型。

Float:浮點型由整數(shù)部分和小數(shù)部分組成，浮點型可以用科學(xué)的計數(shù)方法表示。

復(fù)數(shù):復(fù)數(shù)可以由實部和虛部組成。

b弦

String是python中最常用的數(shù)據(jù)類型，是一種不可變的數(shù)據(jù)類型，可以用單引號或雙引號表示。支持切片操作。

c，列表

List是python中的基本數(shù)據(jù)類型，是一種可變數(shù)據(jù)類型。這些元素用方括號括起來，并用逗號分隔。支持切片操作。

Python 列表生成是一個非常方便的用法。

d，元組

Python元組類似于列表，只是元組的元素不能修改。元組是不可變的數(shù)據(jù)類型。支持切片操作。

E.詞典

Dictionary是python中唯一的映射類型。它以鍵-值對的形式存儲數(shù)據(jù)，字典的鍵必須是不可變的數(shù)據(jù)類型。

總而言之:

不可變數(shù)據(jù)類型:當(dāng)該數(shù)據(jù)類型對應(yīng)變量的值發(fā)生變化時，其對應(yīng)的內(nèi)存地址也會發(fā)生變化。對于這種數(shù)據(jù)類型，稱為不可變數(shù)據(jù)類型。

變量數(shù)據(jù)類型:當(dāng)這個數(shù)據(jù)類型對應(yīng)的變量的值發(fā)生變化時，那么它對應(yīng)的內(nèi)存地址不變。對于這種數(shù)據(jù)類型，稱為可變數(shù)據(jù)類型。

第二，迭代器和生成器

一、迭代器

迭代器對象從集合的第一個元素開始訪問，直到所有元素都被訪問。

創(chuàng)建迭代器對象有兩種方法:1 .對于迭代器對象(列表、字符串、元組)，使用iter()方法創(chuàng)建一個迭代器數(shù)據(jù)類型的迭代器。2.使用 "元組生成和創(chuàng)建迭代對象。

有兩種方法返回迭代器中的元素:1。next()方法，每次調(diào)用都依次返回迭代器中的元素。如果迭代器中沒有元素，將會報告一個錯誤。2.使用for循環(huán)取出元素。

B.發(fā)電機

在Python中，使用yield的函數(shù)稱為生成器。簡單了解下一代迭代器就是迭代器。

在調(diào)用生成器運行的過程中，函數(shù)每次遇到y(tǒng)ield都會暫停并保存當(dāng)前所有運行信息，返回yield的值，下次執(zhí)行next()方法時從當(dāng)前位置繼續(xù)運行。

類似地，也可以使用for循環(huán)調(diào)用生成器。

第三，條件語句

Python條件語句是由一個或多個語句的執(zhí)行結(jié)果(真或假)決定的代碼塊。

Python中用elif代替else if，所以if語句的關(guān)鍵詞是:if–elif–else。其中if和elif要跟條件，滿足條件就執(zhí)行代碼塊，執(zhí)行代碼；如果不滿足，則在else之后執(zhí)行代碼塊。

第四，循環(huán)語句

Python中的循環(huán)語句是for和while。

break語句可以跳出for和while的循環(huán)體。如果從for或while循環(huán)終止，則不會執(zhí)行任何相應(yīng)的循環(huán)else塊。

continue語句用于跳過當(dāng)前循環(huán)塊中剩余的語句，然后繼續(xù)下一個循環(huán)。

動詞（verb的縮寫）功能

功能是一個有組織的、可重用的代碼段，用于實現(xiàn)單個或相關(guān)的功能。函數(shù)可以提高應(yīng)用程序的模塊化和代碼的重用率。

Python為列表、字典和字符串等數(shù)據(jù)類型提供了許多內(nèi)置函數(shù)。以下是這些常用函數(shù)的描述:

列表的功能:

字符串的功能:

字典的功能:

除了Python 的內(nèi)置函數(shù)，還可以設(shè)計自定義函數(shù)。

六、文件操作

Python open()方法用于打開文件并返回file對象。在處理文件的過程中需要這個功能。如果文件無法打開，將引發(fā)異常。

使用open()方法時，一定要關(guān)閉file對象，也就是調(diào)用close()方法。

open方法的兩個常用參數(shù)是file(文件路徑)和mode(讀寫文件的)。常用的模式方法有:

一般用With結(jié)構(gòu)。使用with structur

如何在Python中用scikit-learn生成測試數(shù)據(jù)集？

測試數(shù)據(jù)集是一個小型設(shè)計數(shù)據(jù)集，允許您測試機器學(xué)習(xí)算法或測試工具。

數(shù)據(jù)集中的數(shù)據(jù)有完整的定義(如線性或非線性)，以便您可以探索特定的算法行為。scikit-learn Python庫提供了一組函數(shù)，用于從可配置的測試問題中生成樣本以進行回歸和分類。

在本教程中，您將學(xué)習(xí)測試問題以及如何使用scikit-learn在Python中進行測試。

完成本教程后，您將了解:

如何生成多類分類預(yù)測試題

怎么生成二元分類預(yù)測測試問題

如何生成線性回歸預(yù)測測試題

讓讓我們開始吧。

教程概述

本教程分為三個部分，分別是:

1.測試數(shù)據(jù)集

2.分類試題

3.回歸測試問題

測試數(shù)據(jù)集

開發(fā)和實現(xiàn)機器學(xué)習(xí)算法的一個問題是如何知道你是否正確地實現(xiàn)了它們。出現(xiàn)錯誤時，他們似乎還能工作。

測試數(shù)據(jù)集是一個小的設(shè)計問題，它允許你測試和調(diào)試算法和測試工具。它們也有助于更好地理解算法響應(yīng)參數(shù)變化的行為。

以下是測試數(shù)據(jù)集的一些理想特征:

它們可以快速而容易地生成。

它們包含 "已知 "or "理解 "與預(yù)測進行比較的結(jié)果。

它們是隨機的，每次生成都允許在同一個問題上隨機變化。

它們很小，很容易在二維空間中可視化。

它們可以被放大。

我建議在開始新的機器學(xué)習(xí)算法或開發(fā)新的測試工具時使用測試數(shù)據(jù)集。

Scikit-learn是一個用于機器學(xué)習(xí)的Python庫，它提供了生成一組測試問題的函數(shù)。

在本教程中，我們將查看一些為分類和回歸算法生成測試問題的示例。

分類測試問題

分類是給數(shù)據(jù)分配標(biāo)簽的問題。

在這一節(jié)中，我們將研究三個分類問題:斑點、衛(wèi)星和圓圈。

斑點分類問題

make_blobs() (_)函數(shù)可用于生成高斯分布的blobs點。

您可以控制生成的斑點數(shù)量、生成的樣本數(shù)量以及一系列其他屬性。

考慮到斑點的線性可分性，這個問題也適用于線性分類。

以下示例是一個多類分類預(yù)測問題，它生成一個具有三個斑點的2D樣本數(shù)據(jù)集。

每個數(shù)據(jù)有兩個輸入和0、1或2類的值。

下面顯示了一個完整的示例。

從生成器導(dǎo)入make _ blobs

從matplotlib導(dǎo)入pyplot

從熊貓進口數(shù)據(jù)框

#生成2d分類數(shù)據(jù)集

x，y生成斑點(n _樣本100，中心3，n _特征2)

#散點圖，按類值著色的點

df data frame(dict(xX[:，0]，yX[:，1]，labely))colors {0:r:blu:gr:的key，group

(axax，kindscatter，xx，yy，labelkey，colorcolors[key])

()

運行這個示例將生成問題的輸入和輸出，然后創(chuàng)建一個方便的2D圖，用不同的顏色顯示不同種類的點。

請注意，考慮到問題生成器的隨機性，您的特定數(shù)據(jù)集和結(jié)果圖會有所不同。這是特色，不是錯誤。

斑點測試分類問題的散點圖

在下面的例子中，我們將使用相同的樣本結(jié)構(gòu)。

月亮分類問題

Make_moons()函數(shù)(_)用于二進制分類，將生成一個漩渦圖案，或兩個月亮。

您可以控制月亮形狀的噪波數(shù)量和要生成的樣本數(shù)量。

這個測試問題適用于可以學(xué)習(xí)非線性類邊界的算法。

以下示例生成一個中等噪點的月亮數(shù)據(jù)集。

#生成2d分類數(shù)據(jù)集

x，y make_moons(n_samples100，noise0.1)

下面顯示了一個完整的示例。

從進口make_moons

從matplotlib導(dǎo)入pyplot

從熊貓進口數(shù)據(jù)框

#生成2d分類數(shù)據(jù)集

x，y make_moons(n_samples100，noise0.1)

#散點圖，按類值著色的點

df data frame(dict(xX[:，0]，yX[:，1]，labely))

colors {0:r:blu:的key，group

(axax，kindscatter，xx，yy，labelkey，colorcolors[key])

()

運行此示例將生成并繪制一個數(shù)據(jù)集以供參考，然后根據(jù)指定的類為樣本著色。

Monns測試分類問題的散點圖

圓分類問題

make_circles()函數(shù)(_)會生成數(shù)據(jù)集落入同心圓的二元分類問題。

同樣，和月亮測試問題一樣，你可以控制形狀中的噪波數(shù)量。

該試題適合學(xué)習(xí)復(fù)雜的非線性流行算法。

在下面的示例中，生成了帶有特定噪聲的圓形數(shù)據(jù)集。

#生成2d分類數(shù)據(jù)集

x，y make_circles(n_samples100，noise0.05)

下面顯示了一個完整的示例。

從導(dǎo)入make_circles

從matplotlib導(dǎo)入pyplot

從熊貓進口數(shù)據(jù)框

#生成2d分類數(shù)據(jù)集

x，y make_circles(n_samples100，noise0.05)

#散點圖，按類值著色的點

df data frame(dict(xX[:，0]，yX[:，1]，labely))

colors {0:r:blu:的key，group

(axax，kindscatter，xx，yy，labelkey，colorcolors[key])

()

運行示例并繪制一個數(shù)據(jù)集以供參考。

圓測試分類問題的散點圖

回歸測試問題

回歸是根據(jù)觀測數(shù)據(jù)預(yù)測數(shù)量的問題。

make_regression() (_)函數(shù)將創(chuàng)建一個輸入和輸出之間具有線性關(guān)系的數(shù)據(jù)集。

您可以配置樣本數(shù)量、輸入要素數(shù)量、噪聲級別等。

這個數(shù)據(jù)集適合可以學(xué)習(xí)線性回歸函數(shù)的算法。

以下示例將生成100個中等噪聲的示例，所有示例都有一個輸入要素和一個輸出要素。

#生成回歸數(shù)據(jù)集

x，y mAK _ regression(n _ samples 100，n_features1，noise0.1)

下面顯示了一個完整的示例。

從導(dǎo)入make_regression

從matplotlib導(dǎo)入pyplot

#生成回歸數(shù)據(jù)集

x，y make_regression(n_samples100，n _ features1，noise0.1)

#繪制回歸數(shù)據(jù)集

(X，y)

()

運行這個示例將生成數(shù)據(jù)并繪制x和y之間的關(guān)系，考慮到它是線性的，這很無聊。

回歸測試問題的散點圖

發(fā)展

這一部分列出了一些想法，您可能想探索這些想法來擴展本課程。

比較算法。選擇一個測試問題，比較該問題的一系列算法并報告性能。

放大問題。選擇一個測試問題，并探索如何放大它。用漸進的方法將結(jié)果可視化。你也可以探索一個特定的算法模型技巧和問題尺度。

其他問題。該庫提供了一套其他測試問題；為每個問題編寫了一個代碼示例來展示它們是如何工作的。

進一步閱讀

如果您想更深入地了解，本節(jié)提供了關(guān)于這個主題的更多資源。

sci kit-學(xué)習(xí)用戶指南:數(shù)據(jù)集加載實用程序()

sci kit-了解API:數(shù)據(jù)集(#)

摘要

在本教程中，您了解了測試問題以及如何在Python中使用scikit-learn來使用它們。

具體來說，您學(xué)到了:

如何生成多類分類預(yù)測試題

如何生成二元分類預(yù)測測試題

如何生成線性回歸預(yù)測測試題

卖逼视频免费看片|狼人就干网中文字慕|成人av影院导航|人妻少妇精品无码专区二区妖婧|亚洲丝袜视频玖玖|一区二区免费中文|日本高清无码一区|国产91无码小说|国产黄片子视频91sese日韩|免费高清无码成人网站入口

python用法？

如何在Python中用scikit-learn生成測試數(shù)據(jù)集？

相關(guān)推薦

python用法？