Transforming data into sparse matrices