pandas.arrays.StringArray#

class pandas.arrays.StringArray(values, copy=False)[源代码]#

字符串数据的扩展数组。

1.0.0 新版功能.

警告

字符串数组被认为是试验性的。API的实现和部分内容可能会在没有任何警告的情况下发生更改。

参数
values类似阵列的

数据数组。

警告

目前,这需要一个对象dtype ndarray,其中的元素是Python字符串或NaN-Like (Nonenp.nanNA )。未来,这种情况可能会毫无征兆地发生变化。使用 pandas.array() 使用 dtype="string" 要以一种稳定的方式创建 StringArray 从任何序列。

在 1.5.0 版更改: StringArray现在接受包含NaN-Like的数组Like (Nonenp.nan ),用于 values 除了字符串和 pandas.NA

copy布尔值,默认为False

是否复制数据数组。

参见

array

用于创建String数组的推荐函数。

Series.str

这些字符串方法在由String数组支持的Series上可用。

注意事项

String数组返回比较方法的布尔数组。

示例

>>> pd.array(['This is', 'some text', None, 'data.'], dtype="string")
<StringArray>
['This is', 'some text', <NA>, 'data.']
Length: 4, dtype: string

不同于使用 dtype="object"StringArray 会将值转换为字符串。

>>> pd.array(['1', 1], dtype="object")
<PandasArray>
['1', 1]
Length: 2, dtype: object
>>> pd.array(['1', 1], dtype="string")
<StringArray>
['1', '1']
Length: 2, dtype: string

但是,直接使用非字符串实例化StringArray会引发错误。

对于比较方法, StringArray 返回一个 pandas.BooleanArray

>>> pd.array(["a", None, "c"], dtype="string") == "a"
<BooleanArray>
[True, <NA>, False]
Length: 3, dtype: boolean

属性

None

方法:

None