<div dir="ltr">Hi Matt,<div><br></div><div>Thanks for your detailed email. Forgive my naivety but why do you need the oct-tree in the first place? I have a my own fortran code for constructing a cloud in cell mesh and it uses very little overhead (just the n^3 grid and the particle data itself). I then calculate the dx,dy,dzs to the nearest 8 grid points and distribute accordingly in a omp loop which is done in a fraction of a second. Does the situation with yt come about (oct tree etc.) necessarily because of the way it handles particle data? Is it essentially used to map the particles to domains in the grid or something?</div>
<div><br></div><div>The machine I max memory on has 128GB and the snapshots are using 1024^3 particles. Do you have any idea of how much memory the oct-tree uses as a function of particle/grid number? I am going to try on a 256GB machine (though this is a bit of a hassle). I'll see how I go.</div>
<div><br></div>
<div>Thanks.</div><div><br></div><div>Brendan</div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Sun, Jun 8, 2014 at 6:25 PM, Matthew Turk <span dir="ltr"><<a href="mailto:matthewturk@gmail.com" target="_blank">matthewturk@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi all,<br>
<br>
I feel like I owe a brief explanation of why things are tricky right<br>
now, what we're planning on doing, and how we're experimenting and<br>
developing.<br>
<br>
Presently, the particle geometry handlers build a single mesh from all<br>
particles in the dataset, along with a coarse bitmask that correlates<br>
files to regions in the domain.  This requires the allocation of a<br>
single int64 array of size Nparticles, which is sorted in place and<br>
then fed into an octree construction algorithm that then spits back<br>
out the mesh.  Each octree component contains 3 64-bit integers and<br>
eitehr a void pointer or a pointer to eight other octs.  Increasing<br>
n_ref decreases the number of octs in this mesh; when smoothing<br>
operaitons are conducted, a second "index" mesh is created for looking<br>
up particles near mesh points.  Mesh points are used for adaptive<br>
resolution smoothing and other "deposit particles on the grid somehow"<br>
operations (including SPH kernel).<br>
<br>
Anyway, because right now it requires a global mesh to be constructed,<br>
this is expensive and requires holding a 64-bit integer in memory for<br>
each particle.  I think if you're loading the particles in differently<br>
there is some additional overhead as well, but I'm still a bit<br>
surprised you OOM on a 1024^3 dataset.<br>
<br>
In general, we don't *need* this global mesh; is can be constructed as<br>
required, which would speed up both the initial index phase as well as<br>
the final meshing process.  I got about 50% of the way to implementing<br>
this last fall, but because of various concerns and deadlines I<br>
haven't finished it.  I intend to get back to it probably in July,<br>
right after we put out a 3.0, so that we can have it in time for 3.1.<br>
In principle this will make the particle codes much more similar to<br>
ARTIO, in that the mesh will be constructed only as required and<br>
discarded when no longer required, which will make them much more<br>
memory efficient.<br>
<br>
But, getting a single mesh for extremely large data is a very high<br>
priority; right now for the 10240^3 run we've been loading up<br>
individual sub-chunks, which I want to stop doing.<br>
<br>
>From the technical perspective, these are the things that need to<br>
happen on the yt side for particle datasets to move to this "lazy"<br>
mode of loading; most of this is based on things learned from 2HOT and<br>
ARTIO, and will involve converting to a forest-of-octrees.<br>
<br>
 * Split into spatially-organized subchunks of ParticleOctreeSubset<br>
objects, such that these map 1:Nfiles, and that can be constructed on<br>
the fly.<br>
 * Construct a dual-mesh of the bitmask "ParticleRegion" object that<br>
will help with identifying neighbors to a given oct cell, so that if<br>
we're inside one octree we know which neighbor octrees to grab if we<br>
need particles for smoothing things (fast boundary particle<br>
identification is later down the road)<br>
 * Parallel sort of particles, or using the parallel ring function;<br>
may not be necessary after all<br>
<br>
All of this is doable, and I'd be happy to work with people if they'd<br>
like to take a shot at implementing it, but I've mostly put it on my<br>
list for post-3.0.<br>
<br>
-Matt<br>
<div class="HOEnZb"><div class="h5"><br>
On Sun, Jun 8, 2014 at 2:43 PM, Nathan Goldbaum <<a href="mailto:nathan12343@gmail.com">nathan12343@gmail.com</a>> wrote:<br>
><br>
><br>
><br>
> On Sun, Jun 8, 2014 at 12:27 PM, Brendan Griffen<br>
> <<a href="mailto:brendan.f.griffen@gmail.com">brendan.f.griffen@gmail.com</a>> wrote:<br>
>><br>
>> Also, how do I construct just a zero filled yt array with dimensions<br>
>> (ndim,ndim,ndim)? Thanks<br>
><br>
><br>
><br>
> from yt import YTArray<br>
> from numpy import np<br>
><br>
> arr = YTArray(np.zeros([ndim, ndim, ndim]), input_units=units_string)<br>
><br>
> or alternatively:<br>
><br>
> from yt.units import kiloparsec<br>
><br>
> arr = kiloparsec*np.zeros([ndim, ndim, ndim])<br>
><br>
> it doesn't have to be kiloparsec - you can compose the units you want out of<br>
> any of the unit symbols that live in yt.units.<br>
><br>
> See this page for a ton more detail about yt's new unit system:<br>
> <a href="http://yt-project.org/docs/dev-3.0/analyzing/units/index.html" target="_blank">http://yt-project.org/docs/dev-3.0/analyzing/units/index.html</a><br>
><br>
>><br>
>><br>
>> Brendan<br>
>><br>
>><br>
>> On Sun, Jun 8, 2014 at 3:26 PM, Brendan Griffen<br>
>> <<a href="mailto:brendan.f.griffen@gmail.com">brendan.f.griffen@gmail.com</a>> wrote:<br>
>>><br>
>>> Hi,<br>
>>><br>
>>> Since I get memory errors. Could I not just read in the blocks of the<br>
>>> output individually then basically stack the mesh each time. That way not<br>
>>> every single particle of the snapshot has to be loaded at the same time.<br>
>>> Would that just be a case of doing<br>
>>><br>
>>> level = int(math.log(ndim,2))<br>
>>> cg = ds.covering_grid(level=level,<br>
>>> left_edge=[0,0,0],dims=[ndim,ndim,ndim])<br>
>>> arr = cg['deposit', 'all_density']<br>
>>> arrall += arr<br>
>>><br>
>>> in a loop over each HDF5 block?<br>
><br>
><br>
> It's likely that the memory use is dominated by the octree rather than the<br>
> covering grid.  This is with 1024^3 particles, correct?<br>
><br>
> You can probably significantly reduce the memory used by the octree by<br>
> increasing n_ref in the call to load_particles.<br>
><br>
> See this page for more detail about load_particles:<br>
> <a href="http://yt-project.org/docs/dev-3.0/examining/loading_data.html#generic-particle-data" target="_blank">http://yt-project.org/docs/dev-3.0/examining/loading_data.html#generic-particle-data</a><br>
><br>
> Larger n_ref means fewer octree cells (lower resolution), but it also means<br>
> lower poisson noise and lower memory use.<br>
><br>
> Alternatively, as Matt suggested, you could break your 1024^3 ensemble of<br>
> particles up into chunks, loop over the chunk, creating a particle octree<br>
> and then a covering grid for each subset of the particles.  Your final<br>
> covering grid is just the sub of the covering grids for each subset of<br>
> particles.<br>
><br>
>>><br>
>>><br>
>>> Thanks.<br>
>>> Brendan<br>
>>><br>
>>><br>
>>><br>
>>><br>
>>> On Fri, Jun 6, 2014 at 7:26 PM, Matthew Turk <<a href="mailto:matthewturk@gmail.com">matthewturk@gmail.com</a>><br>
>>> wrote:<br>
>>>><br>
>>>><br>
>>>> On Jun 6, 2014 4:54 PM, "Brendan Griffen" <<a href="mailto:brendan.f.griffen@gmail.com">brendan.f.griffen@gmail.com</a>><br>
>>>> wrote:<br>
>>>> ><br>
>>>> > OK great. It is very low resolution but it worked. Thanks for all your<br>
>>>> > help. My higher resolution run 1024^3 in 100 Mpc seems to crash on 128GB<br>
>>>> > memory machine. I might have to look elsewhere.<br>
>>>> ><br>
>>>><br>
>>>> If you are looking for  low resolution extraction you can tune the<br>
>>>> memory usage by changing the parameter n_ref to something higher.<br>
>>>><br>
>>>> Supporting extremely large datasets in a single mesh is on the roadmap<br>
>>>> for the late summer or fall, after a 3.0 release goes out. For now you can<br>
>>>> also extract before you load in; this is sort of how we are supporting an<br>
>>>> INCITE project with very large particle counts.<br>
>>>><br>
>>>><br>
>>>> > Also, I normally use Canopy distribution but I just use an alias to<br>
>>>> > loadyt which erases my PYTHONPATH and I can't access scipy and a few other<br>
>>>> > libraries any more. What is the best practice here? Should I just manually<br>
>>>> > export PYTHONPATH and point to the libraries need in canopy or can they play<br>
>>>> > nice together?<br>
>>>> ><br>
>>>> > Thanks.<br>
>>>> ><br>
>>>> > BG<br>
>>>> ><br>
>>>> ><br>
>>>> > On Fri, Jun 6, 2014 at 2:54 PM, Nathan Goldbaum<br>
>>>> > <<a href="mailto:nathan12343@gmail.com">nathan12343@gmail.com</a>> wrote:<br>
>>>> >><br>
>>>> >><br>
>>>> >><br>
>>>> >><br>
>>>> >> On Fri, Jun 6, 2014 at 11:48 AM, Brendan Griffen<br>
>>>> >> <<a href="mailto:brendan.f.griffen@gmail.com">brendan.f.griffen@gmail.com</a>> wrote:<br>
>>>> >>><br>
>>>> >>> OK great. Thanks. I just wanted a homogeneous mesh. 512^3 with no<br>
>>>> >>> nesting of any kind. Though when I plot the image it looks like it is<br>
>>>> >>> assigning particles incorrectly (low resolution on the outside). This is<br>
>>>> >>> just a test image.<br>
>>>> >>><br>
>>>> >><br>
>>>> >> The SlicePlot is visualizing the octree so there is less resolution<br>
>>>> >> where there are fewer particles. If you want to visualize the covering grid<br>
>>>> >> you're going to need to visualize that separately.<br>
>>>> >><br>
>>>> >>><br>
>>>> >>> ds = yt.load_particles(data, length_unit=3.08e24,<br>
>>>> >>> mass_unit=1.9891e33,bbox=bbox)<br>
>>>> >>><br>
>>>> >>> ad = ds.all_data()<br>
>>>> >>> print ad['deposit', 'all_cic']<br>
>>>> >>> slc = yt.SlicePlot(ds, 2, ('deposit', 'all_cic'))<br>
>>>> >>> slc.set_figure_size(4)<br>
>>>> >>> cg = ds.covering_grid(level=9, left_edge=[0,0,0],dims=[512,512,512])<br>
>>>> >>><br>
>>>> >><br>
>>>> >> To actually produce the uniform resolution ndarray, you're going to<br>
>>>> >> need to do something like:<br>
>>>> >><br>
>>>> >> array = cg[('deposit', 'all_cic')]<br>
>>>> >><br>
>>>> >> array will then be a 3D array you can do whatever you want with. By<br>
>>>> >> default it has units, but to strip them off you'll just need to cast to<br>
>>>> >> ndarray:<br>
>>>> >><br>
>>>> >> array_without_units = array.v<br>
>>>> >><br>
>>>> >><br>
>>>> >>><br>
>>>> >>> Also, is there a way to load multiple particle types?<br>
>>>> >>><br>
>>>> >>> Do I just need to stack the particles into the array here?<br>
>>>> >>><br>
>>>> >>> data = {'particle_position_x': pos[:,0],<br>
>>>> >>>         'particle_position_y': pos[:,1],<br>
>>>> >>>         'particle_position_z': pos[:,2],<br>
>>>> >>>         'particle_mass': np.array([mpart]*npart)}<br>
>>>> >>><br>
>>>> >>> Then feed it in as usual?<br>
>>>> >><br>
>>>> >><br>
>>>> >> That's right, although if the particle masses are different for the<br>
>>>> >> different particle types that code snippet will need to be generalized to<br>
>>>> >> handle that.<br>
>>>> >><br>
>>>> >> I think in principle it should be possible to make load_particles<br>
>>>> >> handle different particle types just like an SPH dataset that contains<br>
>>>> >> multiple particle types, but right now that hasn't been implemented yet.<br>
>>>> >><br>
>>>> >>><br>
>>>> >>><br>
>>>> >>> Brendan<br>
>>>> >>><br>
>>>> >>><br>
>>>> >>> On Thu, Jun 5, 2014 at 9:44 PM, Nathan Goldbaum<br>
>>>> >>> <<a href="mailto:nathan12343@gmail.com">nathan12343@gmail.com</a>> wrote:<br>
>>>> >>>><br>
>>>> >>>> That's right, you can set that via the bbox keyword parameter for<br>
>>>> >>>> load_particles.  I'd urge you to take a look at the docstrings and source<br>
>>>> >>>> code for load_particles.<br>
>>>> >>>><br>
>>>> >>>><br>
>>>> >>>> On Thu, Jun 5, 2014 at 6:34 PM, Brendan Griffen<br>
>>>> >>>> <<a href="mailto:brendan.f.griffen@gmail.com">brendan.f.griffen@gmail.com</a>> wrote:<br>
>>>> >>>>><br>
>>>> >>>>> Thanks very much Nathan. I tried to load in my own data but I<br>
>>>> >>>>> think there are too many particles or I have to specifically set the domain<br>
>>>> >>>>> size.<br>
>>>> >>>>><br>
>>>> >>>>> In this area:<br>
>>>> >>>>><br>
>>>> >>>>> data = {'particle_position_x': pos[:,0],<br>
>>>> >>>>>         'particle_position_y': pos[:,1],<br>
>>>> >>>>>         'particle_position_z': pos[:,2],<br>
>>>> >>>>>         'particle_mass': np.array([mpart]*npart)}<br>
>>>> >>>>><br>
>>>> >>>>> ds = yt.load_particles(data, length_unit=3.08e24,<br>
>>>> >>>>> mass_unit=1.9891e36)<br>
>>>> >>>>> ad = ds.all_data()<br>
>>>> >>>>> print ad['deposit', 'all_cic']<br>
>>>> >>>>><br>
>>>> >>>>> In [3]: run ytcic.py<br>
>>>> >>>>> yt : [INFO     ] 2014-06-05 21:29:06,183 Parameters: current_time<br>
>>>> >>>>> = 0.0<br>
>>>> >>>>> yt : [INFO     ] 2014-06-05 21:29:06,183 Parameters:<br>
>>>> >>>>> domain_dimensions         = [2 2 2]<br>
>>>> >>>>> yt : [INFO     ] 2014-06-05 21:29:06,184 Parameters:<br>
>>>> >>>>> domain_left_edge          = [ 0.  0.  0.]<br>
>>>> >>>>> yt : [INFO     ] 2014-06-05 21:29:06,185 Parameters:<br>
>>>> >>>>> domain_right_edge         = [ 1.  1.  1.]<br>
>>>> >>>>> yt : [INFO     ] 2014-06-05 21:29:06,185 Parameters:<br>
>>>> >>>>> cosmological_simulation   = 0.0<br>
>>>> >>>>> yt : [INFO     ] 2014-06-05 21:29:06,188 Allocating for 1.342e+08<br>
>>>> >>>>> particles<br>
>>>> >>>>><br>
>>>> >>>>> ---------------------------------------------------------------------------<br>
>>>> >>>>> YTDomainOverflow                          Traceback (most recent<br>
>>>> >>>>> call last)<br>
>>>> >>>>><br>
>>>> >>>>> /nfs/blank/h4231/bgriffen/data/lib/yt-x86_64/lib/python2.7/site-packages/IPython/utils/py3compat.pyc<br>
>>>> >>>>> in execfile(fname, *where)<br>
>>>> >>>>>     202             else:<br>
>>>> >>>>>     203                 filename = fname<br>
>>>> >>>>> --> 204             __builtin__.execfile(filename, *where)<br>
>>>> >>>>><br>
>>>> >>>>><br>
>>>> >>>>> /nfs/blank/h4231/bgriffen/work/projects/caterpillar/c2ray/cic/ytcic.py in<br>
>>>> >>>>> <module>()<br>
>>>> >>>>>      52<br>
>>>> >>>>>      53 ad = ds.all_data()<br>
>>>> >>>>> ---> 54 print ad['deposit', 'all_cic']<br>
>>>> >>>>>      55 slc = yt.SlicePlot(ds, 2, ('deposit', 'all_cic'))<br>
>>>> >>>>>      56 slc.set_figure_size(4)<br>
>>>> >>>>><br>
>>>> >>>>><br>
>>>> >>>>> /bigbang/data/bgriffen/lib/yt-x86_64/src/yt-hg/yt/data_objects/data_containers.pyc<br>
>>>> >>>>> in __getitem__(self, key)<br>
>>>> >>>>>     205         Returns a single field.  Will add if necessary.<br>
>>>> >>>>>     206         """<br>
>>>> >>>>> --> 207         f = self._determine_fields([key])[0]<br>
>>>> >>>>>     208         if f not in self.field_data and key not in<br>
>>>> >>>>> self.field_data:<br>
>>>> >>>>>     209             if f in self._container_fields:<br>
>>>> >>>>><br>
>>>> >>>>><br>
>>>> >>>>> /bigbang/data/bgriffen/lib/yt-x86_64/src/yt-hg/yt/data_objects/data_containers.pyc<br>
>>>> >>>>> in _determine_fields(self, fields)<br>
>>>> >>>>>     453                     raise YTFieldNotParseable(field)<br>
>>>> >>>>>     454                 ftype, fname = field<br>
>>>> >>>>> --> 455                 finfo = self.pf._get_field_info(ftype,<br>
>>>> >>>>> fname)<br>
>>>> >>>>>     456             else:<br>
>>>> >>>>>     457                 fname = field<br>
>>>> >>>>><br>
>>>> >>>>><br>
>>>> >>>>> /bigbang/data/bgriffen/lib/yt-x86_64/src/yt-hg/yt/data_objects/static_output.pyc<br>
>>>> >>>>> in _get_field_info(self, ftype, fname)<br>
>>>> >>>>>     445     _last_finfo = None<br>
>>>> >>>>>     446     def _get_field_info(self, ftype, fname = None):<br>
>>>> >>>>> --> 447         self.index<br>
>>>> >>>>>     448         if fname is None:<br>
>>>> >>>>>     449             ftype, fname = "unknown", ftype<br>
>>>> >>>>><br>
>>>> >>>>><br>
>>>> >>>>> /bigbang/data/bgriffen/lib/yt-x86_64/src/yt-hg/yt/data_objects/static_output.pyc<br>
>>>> >>>>> in index(self)<br>
>>>> >>>>>     277                 raise RuntimeError("You should not<br>
>>>> >>>>> instantiate Dataset.")<br>
>>>> >>>>>     278             self._instantiated_index = self._index_class(<br>
>>>> >>>>> --> 279                 self, dataset_type=self.dataset_type)<br>
>>>> >>>>>     280             # Now we do things that we need an<br>
>>>> >>>>> instantiated index for<br>
>>>> >>>>>     281             # ...first off, we create our field_info now.<br>
>>>> >>>>><br>
>>>> >>>>><br>
>>>> >>>>> /bigbang/data/bgriffen/lib/yt-x86_64/src/yt-hg/yt/frontends/stream/data_structures.pyc<br>
>>>> >>>>> in __init__(self, pf, dataset_type)<br>
>>>> >>>>>     942     def __init__(self, pf, dataset_type = None):<br>
>>>> >>>>>     943         self.stream_handler = pf.stream_handler<br>
>>>> >>>>> --> 944         super(StreamParticleIndex, self).__init__(pf,<br>
>>>> >>>>> dataset_type)<br>
>>>> >>>>>     945<br>
>>>> >>>>>     946     def _setup_data_io(self):<br>
>>>> >>>>><br>
>>>> >>>>><br>
>>>> >>>>> /bigbang/data/bgriffen/lib/yt-x86_64/src/yt-hg/yt/geometry/particle_geometry_handler.pyc<br>
>>>> >>>>> in __init__(self, pf, dataset_type)<br>
>>>> >>>>>      48         self.directory =<br>
>>>> >>>>> os.path.dirname(self.index_filename)<br>
>>>> >>>>>      49         self.float_type = np.float64<br>
>>>> >>>>> ---> 50         super(ParticleIndex, self).__init__(pf,<br>
>>>> >>>>> dataset_type)<br>
>>>> >>>>>      51<br>
>>>> >>>>>      52     def _setup_geometry(self):<br>
>>>> >>>>><br>
>>>> >>>>><br>
>>>> >>>>> /bigbang/data/bgriffen/lib/yt-x86_64/src/yt-hg/yt/geometry/geometry_handler.pyc<br>
>>>> >>>>> in __init__(self, pf, dataset_type)<br>
>>>> >>>>>      54<br>
>>>> >>>>>      55         mylog.debug("Setting up domain geometry.")<br>
>>>> >>>>> ---> 56         self._setup_geometry()<br>
>>>> >>>>>      57<br>
>>>> >>>>>      58         mylog.debug("Initializing data grid data IO")<br>
>>>> >>>>><br>
>>>> >>>>><br>
>>>> >>>>> /bigbang/data/bgriffen/lib/yt-x86_64/src/yt-hg/yt/geometry/particle_geometry_handler.pyc<br>
>>>> >>>>> in _setup_geometry(self)<br>
>>>> >>>>>      52     def _setup_geometry(self):<br>
>>>> >>>>>      53         mylog.debug("Initializing Particle Geometry<br>
>>>> >>>>> Handler.")<br>
>>>> >>>>> ---> 54         self._initialize_particle_handler()<br>
>>>> >>>>>      55<br>
>>>> >>>>>      56<br>
>>>> >>>>><br>
>>>> >>>>><br>
>>>> >>>>> /bigbang/data/bgriffen/lib/yt-x86_64/src/yt-hg/yt/geometry/particle_geometry_handler.pyc<br>
>>>> >>>>> in _initialize_particle_handler(self)<br>
>>>> >>>>>      87                 pf.domain_left_edge, pf.domain_right_edge,<br>
>>>> >>>>>      88                 [N, N, N], len(self.data_files))<br>
>>>> >>>>> ---> 89         self._initialize_indices()<br>
>>>> >>>>>      90         self.oct_handler.finalize()<br>
>>>> >>>>>      91         self.max_level = self.oct_handler.max_level<br>
>>>> >>>>><br>
>>>> >>>>><br>
>>>> >>>>> /bigbang/data/bgriffen/lib/yt-x86_64/src/yt-hg/yt/geometry/particle_geometry_handler.pyc<br>
>>>> >>>>> in _initialize_indices(self)<br>
>>>> >>>>>     109             npart =<br>
>>>> >>>>> sum(data_file.total_particles.values())<br>
>>>> >>>>>     110             morton[ind:ind + npart] = \<br>
>>>> >>>>> --> 111                 self.io._initialize_index(data_file,<br>
>>>> >>>>> self.regions)<br>
>>>> >>>>>     112             ind += npart<br>
>>>> >>>>>     113         morton.sort()<br>
>>>> >>>>><br>
>>>> >>>>><br>
>>>> >>>>> /bigbang/data/bgriffen/lib/yt-x86_64/src/yt-hg/yt/frontends/stream/io.pyc in<br>
>>>> >>>>> _initialize_index(self, data_file, regions)<br>
>>>> >>>>>     144                 raise YTDomainOverflow(pos.min(axis=0),<br>
>>>> >>>>> pos.max(axis=0),<br>
>>>> >>>>>     145<br>
>>>> >>>>> data_file.pf.domain_left_edge,<br>
>>>> >>>>> --> 146<br>
>>>> >>>>> data_file.pf.domain_right_edge)<br>
>>>> >>>>>     147             regions.add_data_file(pos, data_file.file_id)<br>
>>>> >>>>>     148             morton.append(compute_morton(<br>
>>>> >>>>><br>
>>>> >>>>> YTDomainOverflow: Particle bounds [ 0.  0.  0.] and [ 99.99999237<br>
>>>> >>>>> 99.99999237  99.99999237] exceed domain bounds [ 0.  0.  0.] code_length and<br>
>>>> >>>>> [ 1.  1.  1.] code_length<br>
>>>> >>>>><br>
>>>> >>>>><br>
>>>> >>>>><br>
>>>> >>>>> On Thu, Jun 5, 2014 at 8:22 PM, Nathan Goldbaum<br>
>>>> >>>>> <<a href="mailto:nathan12343@gmail.com">nathan12343@gmail.com</a>> wrote:<br>
>>>> >>>>>><br>
>>>> >>>>>> Here's a worked out example that does what you're looking for<br>
>>>> >>>>>> using a fake 1 million particle dataset:<br>
>>>> >>>>>><br>
>>>> >>>>>> <a href="http://nbviewer.ipython.org/gist/ngoldbaum/546d37869aafe71cfe38" target="_blank">http://nbviewer.ipython.org/gist/ngoldbaum/546d37869aafe71cfe38</a><br>
>>>> >>>>>><br>
>>>> >>>>>> In this notebook I make use of two key yt features:<br>
>>>> >>>>>> `load_particles`, and `covering_grid`.<br>
>>>> >>>>>><br>
>>>> >>>>>> load_particles creates a "stream" dataset based on in-memory data<br>
>>>> >>>>>> fed in as a numpy array.  This dataset acts just like an on-disk simulation<br>
>>>> >>>>>> dataset, but doesn't come with the baggage of needing to write a custom<br>
>>>> >>>>>> frontend to read a specific data format off disk.<br>
>>>> >>>>>><br>
>>>> >>>>>> covering_grid is a way to generate uniform resolution data from<br>
>>>> >>>>>> an AMR dataset. It acts like a python dictionary where the keys are field<br>
>>>> >>>>>> names and returns 3D numpy arrays of whatever uniform resolution you specify<br>
>>>> >>>>>> when you create the covering_grid.<br>
>>>> >>>>>><br>
>>>> >>>>>> Note that if you're using load_particles all of your data needs<br>
>>>> >>>>>> to live in memory.  If your data is too big for that you'll need to write a<br>
>>>> >>>>>> frontend for your data format or use a memmap to an on-disk file somehow.<br>
>>>> >>>>>> I'm not an expert on that but others on the list should be able to help out.<br>
>>>> >>>>>><br>
>>>> >>>>>> Hope that gets you well on your way :)<br>
>>>> >>>>>><br>
>>>> >>>>>> -Nathan<br>
>>>> >>>>>><br>
>>>> >>>>>><br>
>>>> >>>>>> On Thu, Jun 5, 2014 at 5:04 PM, Desika Narayanan<br>
>>>> >>>>>> <<a href="mailto:dnarayan@haverford.edu">dnarayan@haverford.edu</a>> wrote:<br>
>>>> >>>>>>><br>
>>>> >>>>>>> Hey Brendan,<br>
>>>> >>>>>>><br>
>>>> >>>>>>> A couple of extra tools you might find helpful in conjunction<br>
>>>> >>>>>>> with Nathan's example of depositing the particles onto an octree are at:<br>
>>>> >>>>>>><br>
>>>> >>>>>>> <a href="http://paste.yt-project.org/show/4737/" target="_blank">http://paste.yt-project.org/show/4737/</a><br>
>>>> >>>>>>><br>
>>>> >>>>>>> Where I load a gadget snapshot, and then recover the coordinates<br>
>>>> >>>>>>> and width of each cell.<br>
>>>> >>>>>>><br>
>>>> >>>>>>> In response to your last question - the particles are deposited<br>
>>>> >>>>>>> into an octree grid (so, you'll see that the cell sizes aren't all the same<br>
>>>> >>>>>>> size).   I don't know if depositing onto a regular NxNxN mesh is possible,<br>
>>>> >>>>>>> though would be interested to hear if so.<br>
>>>> >>>>>>><br>
>>>> >>>>>>> -d<br>
>>>> >>>>>>><br>
>>>> >>>>>>><br>
>>>> >>>>>>> On Thu, Jun 5, 2014 at 7:58 PM, Brendan Griffen<br>
>>>> >>>>>>> <<a href="mailto:brendan.f.griffen@gmail.com">brendan.f.griffen@gmail.com</a>> wrote:<br>
>>>> >>>>>>>><br>
>>>> >>>>>>>> Thanks. I'll get the "bleeding edge" version first then try<br>
>>>> >>>>>>>> your suggestions. Though I want to return the NxNxN array and be able to<br>
>>>> >>>>>>>> write this mesh to a file. It is *only* using the cic part of yt and it<br>
>>>> >>>>>>>> should return the mesh to be written? Just wanted to clarify?<br>
>>>> >>>>>>>><br>
>>>> >>>>>>>> Thanks.<br>
>>>> >>>>>>>> Brendan<br>
>>>> >>>>>>>><br>
>>>> >>>>>>>><br>
>>>> >>>>>>>> On Thu, Jun 5, 2014 at 6:49 PM, Nathan Goldbaum<br>
>>>> >>>>>>>> <<a href="mailto:nathan12343@gmail.com">nathan12343@gmail.com</a>> wrote:<br>
>>>> >>>>>>>>><br>
>>>> >>>>>>>>><br>
>>>> >>>>>>>>><br>
>>>> >>>>>>>>><br>
>>>> >>>>>>>>> On Thu, Jun 5, 2014 at 3:36 PM, John ZuHone<br>
>>>> >>>>>>>>> <<a href="mailto:jzuhone@gmail.com">jzuhone@gmail.com</a>> wrote:<br>
>>>> >>>>>>>>>><br>
>>>> >>>>>>>>>> Hi Brendan,<br>
>>>> >>>>>>>>>><br>
>>>> >>>>>>>>>> Which version of yt are you using?<br>
>>>> >>>>>>>>>><br>
>>>> >>>>>>>>>> If you're using 3.0, this is actually fairly easy. If you<br>
>>>> >>>>>>>>>> look in <a href="http://yt.fields.particle_fields.py" target="_blank">yt.fields.particle_fields.py</a>, around line 85, you can see how this<br>
>>>> >>>>>>>>>> is done for the "particle_density" and "particle_mass" fields. Basically you<br>
>>>> >>>>>>>>>> can call a "deposit" method which takes the particle field quantity you want<br>
>>>> >>>>>>>>>> deposited and deposits it into cells. The underlying calculation is done<br>
>>>> >>>>>>>>>> using Cython, so it's fast.<br>
>>>> >>>>>>>>><br>
>>>> >>>>>>>>><br>
>>>> >>>>>>>>> And you shouldn't ever actually need to call these "deposit"<br>
>>>> >>>>>>>>> functions, since "deposit" is exposed as a field type for all datasets that<br>
>>>> >>>>>>>>> contain particles.<br>
>>>> >>>>>>>>><br>
>>>> >>>>>>>>> Here is a notebook that does this for Enzo AMR data:<br>
>>>> >>>>>>>>><br>
>>>> >>>>>>>>><br>
>>>> >>>>>>>>> <a href="http://nbviewer.ipython.org/gist/ngoldbaum/5e19e4e6cc2bf330149c" target="_blank">http://nbviewer.ipython.org/gist/ngoldbaum/5e19e4e6cc2bf330149c</a><br>
>>>> >>>>>>>>><br>
>>>> >>>>>>>>> This dataset contains about a million particles and generates<br>
>>>> >>>>>>>>> a CIC deposition for the whole domain in about 6 seconds from a cold start.<br>
>>>> >>>>>>>>><br>
>>>> >>>>>>>>>><br>
>>>> >>>>>>>>>><br>
>>>> >>>>>>>>>> If you're using 2.x, then you can do the same thing, but it's<br>
>>>> >>>>>>>>>> not as straightforward. You can see how this works in<br>
>>>> >>>>>>>>>> <a href="http://yt.data_objects.universal_fields.py" target="_blank">yt.data_objects.universal_fields.py</a>, around line 986, where the<br>
>>>> >>>>>>>>>> "particle_density" field is defined. Basically, it calls CICDeposit_3, which<br>
>>>> >>>>>>>>>> is in yt.utilities.lib.CICDeposit.pyx.<br>
>>>> >>>>>>>>>><br>
>>>> >>>>>>>>>> Let me know if you need any more clarification.<br>
>>>> >>>>>>>>>><br>
>>>> >>>>>>>>>> Best,<br>
>>>> >>>>>>>>>><br>
>>>> >>>>>>>>>> John Z<br>
>>>> >>>>>>>>>><br>
>>>> >>>>>>>>>> On Jun 5, 2014, at 6:07 PM, Brendan Griffen<br>
>>>> >>>>>>>>>> <<a href="mailto:brendan.f.griffen@gmail.com">brendan.f.griffen@gmail.com</a>> wrote:<br>
>>>> >>>>>>>>>><br>
>>>> >>>>>>>>>> > Hi,<br>
>>>> >>>>>>>>>> ><br>
>>>> >>>>>>>>>> > I was wondering if there were any Cython routines within yt<br>
>>>> >>>>>>>>>> > which takes particle data and converts it into a cloud-in-cell based mesh<br>
>>>> >>>>>>>>>> > which can be written to a file of my choosing.<br>
>>>> >>>>>>>>><br>
>>>> >>>>>>>>><br>
>>>> >>>>>>>>> What sort of mesh were you looking for?  yt will internally<br>
>>>> >>>>>>>>> construct an octree if it is fed particle data.  I'm not sure whether this<br>
>>>> >>>>>>>>> octree can be saved to disk for later analysis.<br>
>>>> >>>>>>>>><br>
>>>> >>>>>>>>> It's also possible to create a uniform resolution covering<br>
>>>> >>>>>>>>> grid containing field data for a deposited quantity, which can be quite<br>
>>>> >>>>>>>>> easily saved to disk in a number of ways.<br>
>>>> >>>>>>>>><br>
>>>> >>>>>>>>>><br>
>>>> >>>>>>>>>> I heard a while ago there was some such functionality but it<br>
>>>> >>>>>>>>>> could be too far down the yt rabbit hole to be used as a standalone? Is this<br>
>>>> >>>>>>>>>> true? I have my own Python code for doing it but it just isn't fast enough<br>
>>>> >>>>>>>>>> and thought I'd ask the yt community if there were any wrapper tools<br>
>>>> >>>>>>>>>> available to boost the speed.<br>
>>>> >>>>>>>>>> ><br>
>>>> >>>>>>>>>> > Thanks.<br>
>>>> >>>>>>>>>> > Brendan<br>
>>>> >>>>>>>>>> > _______________________________________________<br>
>>>> >>>>>>>>>> > yt-users mailing list<br>
>>>> >>>>>>>>>> > <a href="mailto:yt-users@lists.spacepope.org">yt-users@lists.spacepope.org</a><br>
>>>> >>>>>>>>>> ><br>
>>>> >>>>>>>>>> > <a href="http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org" target="_blank">http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org</a><br>
>>>> >>>>>>>>>><br>
>>>> >>>>>>>>>> _______________________________________________<br>
>>>> >>>>>>>>>> yt-users mailing list<br>
>>>> >>>>>>>>>> <a href="mailto:yt-users@lists.spacepope.org">yt-users@lists.spacepope.org</a><br>
>>>> >>>>>>>>>><br>
>>>> >>>>>>>>>> <a href="http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org" target="_blank">http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org</a><br>
>>>> >>>>>>>>><br>
>>>> >>>>>>>>><br>
>>>> >>>>>>>>><br>
>>>> >>>>>>>>> _______________________________________________<br>
>>>> >>>>>>>>> yt-users mailing list<br>
>>>> >>>>>>>>> <a href="mailto:yt-users@lists.spacepope.org">yt-users@lists.spacepope.org</a><br>
>>>> >>>>>>>>> <a href="http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org" target="_blank">http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org</a><br>
>>>> >>>>>>>>><br>
>>>> >>>>>>>><br>
>>>> >>>>>>>><br>
>>>> >>>>>>>> _______________________________________________<br>
>>>> >>>>>>>> yt-users mailing list<br>
>>>> >>>>>>>> <a href="mailto:yt-users@lists.spacepope.org">yt-users@lists.spacepope.org</a><br>
>>>> >>>>>>>> <a href="http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org" target="_blank">http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org</a><br>
>>>> >>>>>>>><br>
>>>> >>>>>>><br>
>>>> >>>>>>><br>
>>>> >>>>>>> _______________________________________________<br>
>>>> >>>>>>> yt-users mailing list<br>
>>>> >>>>>>> <a href="mailto:yt-users@lists.spacepope.org">yt-users@lists.spacepope.org</a><br>
>>>> >>>>>>> <a href="http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org" target="_blank">http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org</a><br>
>>>> >>>>>>><br>
>>>> >>>>>><br>
>>>> >>>>>><br>
>>>> >>>>>> _______________________________________________<br>
>>>> >>>>>> yt-users mailing list<br>
>>>> >>>>>> <a href="mailto:yt-users@lists.spacepope.org">yt-users@lists.spacepope.org</a><br>
>>>> >>>>>> <a href="http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org" target="_blank">http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org</a><br>
>>>> >>>>>><br>
>>>> >>>>><br>
>>>> >>>>><br>
>>>> >>>>> _______________________________________________<br>
>>>> >>>>> yt-users mailing list<br>
>>>> >>>>> <a href="mailto:yt-users@lists.spacepope.org">yt-users@lists.spacepope.org</a><br>
>>>> >>>>> <a href="http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org" target="_blank">http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org</a><br>
>>>> >>>>><br>
>>>> >>>><br>
>>>> >>>><br>
>>>> >>>> _______________________________________________<br>
>>>> >>>> yt-users mailing list<br>
>>>> >>>> <a href="mailto:yt-users@lists.spacepope.org">yt-users@lists.spacepope.org</a><br>
>>>> >>>> <a href="http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org" target="_blank">http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org</a><br>
>>>> >>>><br>
>>>> >>><br>
>>>> >>><br>
>>>> >>> _______________________________________________<br>
>>>> >>> yt-users mailing list<br>
>>>> >>> <a href="mailto:yt-users@lists.spacepope.org">yt-users@lists.spacepope.org</a><br>
>>>> >>> <a href="http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org" target="_blank">http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org</a><br>
>>>> >>><br>
>>>> >><br>
>>>> >><br>
>>>> >> _______________________________________________<br>
>>>> >> yt-users mailing list<br>
>>>> >> <a href="mailto:yt-users@lists.spacepope.org">yt-users@lists.spacepope.org</a><br>
>>>> >> <a href="http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org" target="_blank">http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org</a><br>
>>>> >><br>
>>>> ><br>
>>>> ><br>
>>>> > _______________________________________________<br>
>>>> > yt-users mailing list<br>
>>>> > <a href="mailto:yt-users@lists.spacepope.org">yt-users@lists.spacepope.org</a><br>
>>>> > <a href="http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org" target="_blank">http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org</a><br>
>>>> ><br>
>>>><br>
>>>><br>
>>>> _______________________________________________<br>
>>>> yt-users mailing list<br>
>>>> <a href="mailto:yt-users@lists.spacepope.org">yt-users@lists.spacepope.org</a><br>
>>>> <a href="http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org" target="_blank">http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org</a><br>
>>>><br>
>>><br>
>><br>
>><br>
>> _______________________________________________<br>
>> yt-users mailing list<br>
>> <a href="mailto:yt-users@lists.spacepope.org">yt-users@lists.spacepope.org</a><br>
>> <a href="http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org" target="_blank">http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org</a><br>
>><br>
><br>
><br>
> _______________________________________________<br>
> yt-users mailing list<br>
> <a href="mailto:yt-users@lists.spacepope.org">yt-users@lists.spacepope.org</a><br>
> <a href="http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org" target="_blank">http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org</a><br>
><br>
_______________________________________________<br>
yt-users mailing list<br>
<a href="mailto:yt-users@lists.spacepope.org">yt-users@lists.spacepope.org</a><br>
<a href="http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org" target="_blank">http://lists.spacepope.org/listinfo.cgi/yt-users-spacepope.org</a><br>
</div></div></blockquote></div><br></div>