【Pythonの基礎】Pythonでのデータ解析について優しく解説

Pythonを使ってデータ解析を行う際には、NumPy、Pandas、Matplotlibといった外部ライブラリを活用します。
今回は、これらのライブラリの基本的な使い方を学んでいきます。

NumPy

NumPyは、Pythonで数値計算を効率的に行うためのライブラリです。配列や行列の操作が簡単にできます。

import numpy as np

# 配列の作成
array1 = np.array([1, 2, 3, 4, 5])

# 配列の演算
array2 = array1 * 2
print(array2)

# 行列の作成
matrix1 = np.array([[1, 2], [3, 4]])

# 行列の積
matrix2 = np.dot(matrix1, matrix1)
print(matrix2)
PR

Pandas

Pandasは、データ分析において頻繁に用いられるライブラリです。表形式のデータを効率的に操作できます。

import pandas as pd

# データフレームの作成
data = {
    "Name": ["Alice", "Bob", "Charlie"],
    "Age": [25, 30, 35],
    "City": ["Tokyo", "Osaka", "Nagoya"]
}
df = pd.DataFrame(data)

# データの選択
selected_data = df[df["Age"] > 25]

# データの並べ替え
sorted_data = df.sort_values(by="Age", ascending=False)
PR

Matplotlib

Matplotlibは、Pythonでグラフを描画するためのライブラリです。さまざまなグラフを簡単に作成できます。

import matplotlib.pyplot as plt

# 折れ線グラフ
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]
plt.plot(x, y)
plt.show()

# 棒グラフ
x = ["A", "B", "C"]
y = [3, 6, 9]
plt.bar(x, y)
plt.show()

# 散布図
x = [1, 2, 3, 4, 5]
y = [5, 4, 3, 2, 1]
plt.scatter(x, y)
plt.show()
PR

この記事が気に入ったら
フォローしてね!

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!