mars.dataframe.DataFrame.to_csv#

DataFrame.to_csv(path, sep=',', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, compression='infer', quoting=None, quotechar='"', line_terminator=None, chunksize=None, date_format=None, doublequote=True, escapechar=None, decimal='.', storage_options=None)#

将对象写入逗号分隔值（csv）文件。

Parameters

path (str) – 文件路径。如果路径是一个带有通配符的字符串，例如‘/to/path/out-*.csv’， to_csv将尝试写入多个文件，例如， chunk (0, 0)将数据写入‘/to/path/out-0.csv’。如果路径是一个没有通配符的字符串，所有数据将被写入一个单独的文件。
sep (str, default ',') – 长度为1的字符串。输出文件的字段分隔符。
na_rep (str, default '') – 缺失数据的表示。
float_format (str, 默认值为 None) – 浮点数的格式字符串。
columns (序列, 可选) – 要写入的列。
header (bool 或 list 的 str, 默认是 True) – 输出列名。如果提供了一组字符串，则假定它们是列名的别名。
index (bool, 默认值为 True) – 写入行名称（索引）。
index_label (str 或 sequence, 或 False, 默认为 None) – 如果需要，为索引列提供列标签。如果给定 None，并且 header 和 index 为 True，则使用索引名称。如果对象使用 MultiIndex，则应该提供一个序列。如果 False 不打印索引名称的字段。使用 index_label=False 以便在 R 中更容易导入。
mode (str) – Python 写入模式，默认为 'w'。
encoding (str, optional) – 一个表示用于输出文件的编码的字符串，默认为‘utf-8’。
compression (str 或 dict, 默认 'infer') – 如果是 str，表示压缩模式。如果是 dict，‘method’ 的值是压缩模式。压缩模式可以是以下可能值中的任何一个：{‘infer’, ‘gzip’, ‘bz2’, ‘zip’, ‘xz’, None}。如果压缩模式是 ‘infer’ 且 path_or_buf 是路径类，则从以下扩展名检测压缩模式：‘.gz’，‘.bz2’，‘.zip’ 或 ‘.xz’。（否则不进行压缩）。如果给定 dict 并且模式为 ‘zip’ 或推断为 ‘zip’，其他条目作为附加压缩选项传入。
引用 (来自csv模块的可选常量) – 默认为csv.QUOTE_MINIMAL。如果您设置了float_format，则浮点数将被转换为字符串，因此csv.QUOTE_NONNUMERIC将将它们视为非数字。
quotechar (str, default '"') – 长度为1的字符串。用于引用字段的字符。
line_terminator (str, 可选) – 输出文件中使用的换行符或字符序列。默认为 os.linesep，这取决于调用此方法的操作系统（对于linux为'、对于Windows为'rn'，即）。
chunksize (int 或 None) – 每次写入的行数。
date_format (str, 默认值为 None) – 用于 datetime 对象的格式字符串。
doublequote (bool, 默认值为 True) – 控制字段内 quotechar 的引号。
escapechar (str, default None) – 长度为 1 的字符串。在适当的时候，用于转义 sep 和 quotechar 的字符。
decimal (str, default '.') – 识别为小数分隔符的字符。例如，用‘,’表示欧洲数据。

Returns

如果 path_or_buf 为 None，则返回结果的 csv 格式作为字符串。否则返回 None。

Return type

无或 str

另请参阅

read_csv: 将CSV文件加载到DataFrame中。

示例

>>> import mars.dataframe as md
>>> df = md.DataFrame({'name': ['Raphael', 'Donatello'],
...                    'mask': ['red', 'purple'],
...                    'weapon': ['sai', 'bo staff']})
>>> df.to_csv('out.csv', index=False).execute()