IT

Pandasを複数条件で抽出する

  • English (United States)
  • 日本語

動作環境はWindows10 64bitでPython3.6.5(Anaconda3.5.1-0)。

pandas のデータフレームから特定の条件のものを抜き出したい時がある。

例えば下記のようなデーフレームを考える。

In [5]:
# -*- coding: utf-8 -*-</pre>
import pandas as pd
df=pd.DataFrame({"A":[1,2,3,4,5],"B":[11,12,13,14,15]})
print(df)

Out [5]:
   col1  col2
0     1    11
1     2    12
2     3    13
3     4    14
4     5    15

このとき、c1のカラムから2以上のものを抜き出す際のコードは下記になる。
df=df[df[“col1”]=2]]

In [6]:
df=df[df["col1"]>=2]
print(df)

col1 col2
1 2 12
2 3 13
3 4 14
4 5 15

 

 

さらに4以下のものを抜き出したいときは、下記のように書くと論理積を求めることができる
df=df[(df[“col1”]>=2) & (df[“col1”]<=4)]

[python]
In [7]:
df=df[(df[“col1”]>=2) & (df[“col1”]<=4)]
print(df)

col1 col2
1 2 12
2 3 13
3 4 14

[/python]

条件ごとに()でくくることになっている

ABOUT ME
Masaya
テラプログラミングとは造語です。テラ=地球・陸地といった意味があるので、思い描いた理想をプログラミングで実現する=テラプログラミングと名付けています。 1987年生まれです。 職業はメーカでエンジニアをしており、それはそれで好きなのですが、好奇心と探求心、それと本当はコンプレックスのせいもあったのかもしれませんが、瞑想や心理学、いわゆる”スピリチュアル系”方面が昔から大好きです。