В Polars методы select
and with_column
передают любые скаляры, которые они получают, включая литералы:
import polars as pl
df.with_column(pl.lit(1).alias("y"))
# shape: (3, 2)
# ┌─────┬─────┐
# │ x ┆ y │
# │ --- ┆ --- │
# │ i64 ┆ i64 │
# ╞═════╪═════╡
# │ 1 ┆ 1 │
# ├╌╌╌╌╌┼╌╌╌╌╌┤
# │ 2 ┆ 1 │
# ├╌╌╌╌╌┼╌╌╌╌╌┤
# │ 3 ┆ 1 │
# └─────┴─────┘
Метод agg
не транслирует литералы:
import polars as pl
df = pl.DataFrame(dict(x=[1,1,0,0])).groupby("x")
df.agg(pl.lit(1).alias("y"))
# exceptions.ComputeError: returned aggregation is a different length: 1 than the group lengths: 2
Есть ли операция, которую я могу применить, которая будет транслировать скаляр и игнорировать нескаляр? Что-то вроде этого:
df.agg(something(pl.lit(1)).alias("y"))
# shape: (2, 2)
# ┌─────┬─────┐
# │ x ┆ y │
# │ --- ┆ --- │
# │ i64 ┆ i64 │
# ╞═════╪═════╡
# │ 0 ┆ 1 │
# ├╌╌╌╌╌┼╌╌╌╌╌┤
# │ 1 ┆ 1 │
# └─────┴─────┘
Решение проблемы
Вам нужно будет использовать pl.repeat(1, pl.count())
для расширения литерала до размера группы.
(ответ от трекера Polars Issue — https://github.com/pola-rs/polars/issues/2987#issuecomment-1079617229 )
Комментариев нет:
Отправить комментарий