CLN: preallocate data array only once

y-p · y-p · commit 616347c98a1b · 2013-03-19T09:17:16.000+02:00
diff --git a/pandas/core/format.py b/pandas/core/format.py
@@ -798,6 +798,11 @@ def __init__(self, obj, path_or_buf, sep=",", na_rep='', float_format=None,
             cols=list(cols)
         self.cols = cols
 
+        # preallocate data 2d list
+        self.blocks = self.obj._data.blocks
+        ncols = sum(len(b.items) for b in self.blocks)
+        self.data =[None] * ncols
+
         # fail early if we have duplicate columns
         if len(set(self.cols)) != len(self.cols):
             raise Exception("duplicate columns are not permitted in to_csv")
@@ -1001,18 +1006,17 @@ def _save_chunk(self, start_i, end_i):
         data_index  = self.data_index
 
         # create the data for a chunk
-        blocks = self.obj._data.blocks
-        data =[None] * sum(len(b.items) for b in blocks)
         slicer = slice(start_i,end_i)
-        for i in range(len(blocks)):
-            b = blocks[i]
+        for i in range(len(self.blocks)):
+            b = self.blocks[i]
             d = b.to_native_types(slicer=slicer, na_rep=self.na_rep, float_format=self.float_format)
             for j, k in enumerate(b.items):
-                data[colname_map[k]] = d[j]
+                # self.data is a preallocated list
+                self.data[colname_map[k]] = d[j]
 
         ix = data_index.to_native_types(slicer=slicer, na_rep=self.na_rep, float_format=self.float_format)
 
-        lib.write_csv_rows(data, ix, self.nlevels, self.cols, self.writer)
+        lib.write_csv_rows(self.data, ix, self.nlevels, self.cols, self.writer)
 
 # from collections import namedtuple
 # ExcelCell = namedtuple("ExcelCell",