<div dir="auto">Hi,<div dir="auto"><br></div><div dir="auto">I'm okay with this, but let's try to make it obvious where things go. (which you have all suggested.)</div><div dir="auto"><br></div><div dir="auto">I think astropy does this and has helper functions for it.</div><div dir="auto"><br></div><div dir="auto">Matt</div></div><div class="gmail_extra"><br><div class="gmail_quote">On Dec 8, 2016 9:28 AM, "Britton Smith" <<a href="mailto:brittonsmith@gmail.com">brittonsmith@gmail.com</a>> wrote:<br type="attribution"><blockquote class="quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">HI all,<div><br></div><div>I agree that it would be best to keep the data files out of the repo.  What about adding some config variables to control where the data gets stored?  We could even have it default to storing things in .config/yt.  Perhaps, on the first import when the data is not there, you just get a notice with links to wget/curl them.</div><font color="#888888"><div><br></div><div>Britton</div></font></div><div class="elided-text"><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Dec 7, 2016 at 12:12 PM, Nathan Goldbaum <span dir="ltr"><<a href="mailto:nathan12343@gmail.com" target="_blank">nathan12343@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><br><div class="gmail_extra"><br><div class="gmail_quote"><span>On Wed, Dec 7, 2016 at 1:30 PM, John Zuhone <span dir="ltr"><<a href="mailto:jzuhone@gmail.com" target="_blank">jzuhone@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">



<div>
<div name="messageBodySection">Hi everyone,
<div><br></div>
<div>I just issued PR 2465 (<a href="https://bitbucket.org/yt_analysis/yt/pull-requests/2465/wip-port-the-spectral_integrator-analysis/" target="_blank">https://bitbucket.org/yt_anal<wbr>ysis/yt/pull-requests/2465/wip<wbr>-port-the-spectral_integrator-<wbr>analysis/</a>) to port the spectral integrator analysis module (originally written by Britton) under yt.fields. spectral_integrator is an analysis module that creates X-ray emission fields in user-specified energy bands. </div>
<div><br></div>
<div>The hitch is that spectral_integrator uses HDF5 tables to compute the emissivity, since they are not analytical functions. We currently host those tables on <a href="http://yt-project.org/data" target="_blank">yt-project.org/data</a>. spectral_integrator downloads them automatically if the analysis module is used and they are not present. </div>
<div><br></div>
<div>There was some discussion on Slack as to whether or not this is the correct approach, since it’s not ideal for certain computing environments (e.g., HPC). </div></div></div></blockquote><div><br></div></span><div>Also a problem for e.g. packaging yt on linux distros.</div><span><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div name="messageBodySection"><div>The files are a total of about 2.4 MB in size, so there is some reticence to bundling them with yt. </div></div></div></blockquote><div><br></div></span><div>So my main concern here is adding them to the repo. If you could figure out a way to add them to the source distribution without including them in the repo (and then issue an error with a URL for non-sdist builds of yt [e.g. from the repo]), it wouldn't be a problem.</div><div><br></div><div>This isn't really a generic solution for all binary files we might want to send to users, but 2.4 MB isn't all that big to be part of an sdist or wheel.</div><span><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div name="messageBodySection"><div></div>
<div>There is also the issue that uploading new versions of the tables breaks backward-compatibility. I have sacrificed backwards-compatiblity for considerable simplification of code.</div></div></div></blockquote><div><br></div></span><div>I think the solution is just to use different names for the files or the hdf5 datasets or groups here so the code can tell the difference.</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span><div><div name="messageBodySection">
<div><br></div>
<div>Does anyone have any ideas about the best way to handle this issue?</div>
<div><br></div>
<div>Best,</div>
<div><br></div>
<div>John Z</div>
</div>
</div>

<br></span>______________________________<wbr>_________________<br>
yt-dev mailing list<br>
<a href="mailto:yt-dev@lists.spacepope.org" target="_blank">yt-dev@lists.spacepope.org</a><br>
<a href="http://lists.spacepope.org/listinfo.cgi/yt-dev-spacepope.org" rel="noreferrer" target="_blank">http://lists.spacepope.org/lis<wbr>tinfo.cgi/yt-dev-spacepope.org</a><br>
<br></blockquote></div><br></div></div>
<br>______________________________<wbr>_________________<br>
yt-dev mailing list<br>
<a href="mailto:yt-dev@lists.spacepope.org" target="_blank">yt-dev@lists.spacepope.org</a><br>
<a href="http://lists.spacepope.org/listinfo.cgi/yt-dev-spacepope.org" rel="noreferrer" target="_blank">http://lists.spacepope.org/lis<wbr>tinfo.cgi/yt-dev-spacepope.org</a><br>
<br></blockquote></div><br></div>
</div><br>______________________________<wbr>_________________<br>
yt-dev mailing list<br>
<a href="mailto:yt-dev@lists.spacepope.org">yt-dev@lists.spacepope.org</a><br>
<a href="http://lists.spacepope.org/listinfo.cgi/yt-dev-spacepope.org" rel="noreferrer" target="_blank">http://lists.spacepope.org/<wbr>listinfo.cgi/yt-dev-spacepope.<wbr>org</a><br>
<br></blockquote></div><br></div>