DataFrame
是polars的核心数据结构, 可以将它理解为一个n行m列组成的二维表格
1import polars as pl
2
3# 下面就是一个DataFrame, dict中的三个key: "a","b","c" 就是三个列的列名,
4# 它们的value分别是对应列的值
5df: pl.DataFrame = pl.DataFrame(
6 {
7 "a": ["a", "b", "a", "b", "c"],
8 "b": [1, 2, 1, 3, 3],
9 "c": [5, 4, 3, 2, 1],
10 }
11)
12
13print(df)
14"""
15下面是输出: 形状(5行3列)+数据, 同时注意到表格的表头也标注了每个列的数据类型
16polars会自动解析数据类型, 关于类型解析稍后还会提到
17tip: 如果有一列的长度和其他列不同, polars会报错
18shape: (5, 3)
19┌─────┬─────┬─────┐
20│ a ┆ b ┆ c │
21│ --- ┆ --- ┆ --- │
22│ str ┆ i64 ┆ i64 │
23╞═════╪═════╪═════╡
24│ a ┆ 1 ┆ 5 │
25│ b ┆ 2 ┆ 4 │
26│ a ┆ 1 ┆ 3 │
27│ b ┆ 3 ┆ 2 │
28│ c ┆ 3 ┆ 1 │
29└─────┴─────┴─────┘
30"""