DateFrame

DataFrame是polars的核心数据结构, 可以将它理解为一个n行m列组成的二维表格

1import polars as pl
2
3# 下面就是一个DataFrame, dict中的三个key: "a","b","c" 就是三个列的列名,
4# 它们的value分别是对应列的值
5df: pl.DataFrame = pl.DataFrame(
6      {
7          "a": ["a", "b", "a", "b", "c"],
8          "b": [1, 2, 1, 3, 3],
9          "c": [5, 4, 3, 2, 1],
10      }
11)
12
13print(df)
14"""
15下面是输出: 形状(5行3列)+数据, 同时注意到表格的表头也标注了每个列的数据类型
16polars会自动解析数据类型, 关于类型解析稍后还会提到
17tip: 如果有一列的长度和其他列不同, polars会报错
18shape: (5, 3)
19┌─────┬─────┬─────┐
20│ a   ┆ b   ┆ c   │
21│ --- ┆ --- ┆ --- │
22│ str ┆ i64 ┆ i64 │
23╞═════╪═════╪═════╡
24│ a   ┆ 1   ┆ 5   │
25│ b   ┆ 2   ┆ 4   │
26│ a   ┆ 1   ┆ 3   │
27│ b   ┆ 3   ┆ 2   │
28│ c   ┆ 3   ┆ 1   │
29└─────┴─────┴─────┘
30"""