mars.dataframe.DataFrame.to_csv#
- DataFrame.to_csv(path, sep=',', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, compression='infer', quoting=None, quotechar='"', line_terminator=None, chunksize=None, date_format=None, doublequote=True, escapechar=None, decimal='.', storage_options=None)#
将对象写入逗号分隔值(csv)文件。
- Parameters
path (str) – 文件路径。 如果路径是一个带有通配符的字符串,例如‘/to/path/out-*.csv’, to_csv将尝试写入多个文件,例如, chunk (0, 0)将数据写入‘/to/path/out-0.csv’。 如果路径是一个没有通配符的字符串, 所有数据将被写入一个单独的文件。
sep (str, default ',') – 长度为1的字符串。输出文件的字段分隔符。
na_rep (str, default '') – 缺失数据的表示。
float_format (str, 默认值为 None) – 浮点数的格式字符串。
columns (序列, 可选) – 要写入的列。
header (bool 或 list 的 str, 默认是 True) – 输出列名。如果提供了一组字符串,则假定它们是列名的别名。
index (bool, 默认值为 True) – 写入行名称(索引)。
index_label (str 或 sequence, 或 False, 默认为 None) – 如果需要,为索引列提供列标签。如果给定 None,并且 header 和 index 为 True,则使用索引名称。如果对象使用 MultiIndex,则应该提供一个序列。如果 False 不打印索引名称的字段。使用 index_label=False 以便在 R 中更容易导入。
mode (str) – Python 写入模式,默认为 'w'。
encoding (str, optional) – 一个表示用于输出文件的编码的字符串,默认为‘utf-8’。
compression (str 或 dict, 默认 'infer') – 如果是 str,表示压缩模式。如果是 dict,‘method’ 的值是压缩模式。压缩模式可以是以下可能值中的任何一个:{‘infer’, ‘gzip’, ‘bz2’, ‘zip’, ‘xz’, None}。如果压缩模式是 ‘infer’ 且 path_or_buf 是路径类,则从以下扩展名检测压缩模式:‘.gz’,‘.bz2’,‘.zip’ 或 ‘.xz’。(否则不进行压缩)。如果给定 dict 并且模式为 ‘zip’ 或推断为 ‘zip’,其他条目作为附加压缩选项传入。
引用 (来自csv模块的可选常量) – 默认为csv.QUOTE_MINIMAL。如果您设置了float_format,则浮点数将被转换为字符串,因此csv.QUOTE_NONNUMERIC将将它们视为非数字。
quotechar (str, default '"') – 长度为1的字符串。用于引用字段的字符。
line_terminator (str, 可选) – 输出文件中使用的换行符或字符序列。默认为 os.linesep,这取决于调用此方法的操作系统(对于linux为'、对于Windows为'rn',即)。
chunksize (int 或 None) – 每次写入的行数。
date_format (str, 默认值为 None) – 用于 datetime 对象的格式字符串。
doublequote (bool, 默认值为 True) – 控制字段内 quotechar 的引号。
escapechar (str, default None) – 长度为 1 的字符串。在适当的时候,用于转义 sep 和 quotechar 的字符。
decimal (str, default '.') – 识别为小数分隔符的字符。例如,用‘,’表示欧洲数据。
- Returns
如果 path_or_buf 为 None,则返回结果的 csv 格式作为字符串。否则返回 None。
- Return type
无或 str
另请参阅
read_csv将CSV文件加载到DataFrame中。
示例
>>> import mars.dataframe as md >>> df = md.DataFrame({'name': ['Raphael', 'Donatello'], ... 'mask': ['red', 'purple'], ... 'weapon': ['sai', 'bo staff']}) >>> df.to_csv('out.csv', index=False).execute()