26 Sep 2022
|
beginner
python
author: jackfrued
Pandas的應用-3
DataFrame的應用
數據清洗
通常,我們從 Excel、CSV 或數據庫中獲取到的數據並不是非常完美的,里面可能因為系統或人為的原因混入了重覆值或異常值,也可能在某些字段上存在缺失值;再者,DataFrame中的數據也可能存在格式不統一、量綱不統一等各種問題。因此,在開始數據分析之前,對數據進行清洗就顯得特別重要。
26 Sep 2022
|
beginner
python
author: jackfrued
Pandas的應用-1
Pandas是Wes McKinney在2008年開發的一個強大的分析結構化數據的工具集。Pandas以NumPy為基礎(數據表示和運算),提供了用於數據處理的函數和方法,對數據分析和數據挖掘提供了很好的支持;同時Pandas還可以跟數據可視化工具Matplotlib很好的整合在一起,非常輕松愉快的實現數據的可視化展示。
25 Sep 2022
|
beginner
python
author: jackfrued
NumPy的應用-2
數組的運算
使用 NumPy 最為方便的是當需要對數組元素進行運算時,不用編寫循環代碼遍歷每個元素,所有的運算都會自動的矢量化(使用高效的、提前編譯的底層代碼來對數據序列進行數學操作)。簡單的說就是,NumPy 中的數學運算和數學函數會自動作用於數組中的每個成員。
25 Sep 2022
|
beginner
python
author: jackfrued
NumPy的應用-1
Numpy 是一個開源的 Python 科學計算庫,用於快速處理任意維度的數組。Numpy 支持常見的數組和矩陣操作,對於同樣的數值計算任務,使用 NumPy 不僅代碼要簡潔的多,而且 NumPy 的性能遠遠優於原生 Python,基本是一個到兩個數量級的差距,而且數據量越大,NumPy 的優勢就越明顯。