Are there any command-line tools to take a sound file (e.g. wav or mp3 format) and output a corresponding audio-range spectrogram<div>as one or more image files, either jpg,gif,png ?? Yes, it would be a very &quot;long&quot; image, or a series multiple images, each w/ a minute of spectrogram representation of sound.</div>
<div><br></div><div>Preferable would be something  like what <a href="http://www.sonicvisualiser.org/">http://www.sonicvisualiser.org/</a> outputs in &quot;Layer-&gt;Add Melodic Range Spectrogram-&gt; All Channels Mixed&quot;</div>
<div><br></div><div>I&#39;m aware of exellent tools like <a href="http://vamp-plugins.org/">http://vamp-plugins.org/</a> &amp;&amp; could certainly script something out of sonic-annotator, which would be too slow (the scripting and unnecessary I/O would be slow, not sonic-annotator itself).</div>
<div><br></div><div>Anybody have a <a href="http://vamp-plugins.org/vampy.html">http://vamp-plugins.org/vampy.html</a> script that accomplishes this task before I go off and reinvent the wheel. Or better yet, an all-C or C++ solution?</div>
<div><br></div><div>One issue is how can a program automatically determine the best visualization of a spectrogram? </div><div>Sonic-visualizer has controls like &quot;Threshold&quot; &quot;Colour Rotation&quot; and meter &quot;Gain&quot; that sometimes need to be tweaked. Anybody</div>
<div>know where to find such a file-&gt;spectrum-image converter that automatically adjusts for best contrast between beats, bass, melody, </div><div>so as to produce something that lets people easily visualize music features, without needing to do any manual adjustments??</div>
<div><br></div><div><br></div><div>Thanks,</div><div><br></div><meta http-equiv="content-type" content="text/html; charset=utf-8"><div>Niels<br><a href="http://nielsmayer.com">http://nielsmayer.com</a></div><div> </div><div>
PS: speaking of spectrograms:
</div><div><div style="border-top-color: rgb(204, 204, 204); border-right-color: rgb(204, 204, 204); border-bottom-color: rgb(204, 204, 204); border-left-color: rgb(204, 204, 204); font-family: verdana, geneva, helvetica, arial, sans-serif; font-size: 13px; border-collapse: collapse; -webkit-border-horizontal-spacing: 2px; -webkit-border-vertical-spacing: 2px; ">
<span>Music: Broken Symmetry, Geometry, and Complexity </span></div><div style="border-top-color: rgb(204, 204, 204); border-right-color: rgb(204, 204, 204); border-bottom-color: rgb(204, 204, 204); border-left-color: rgb(204, 204, 204); font-family: verdana, geneva, helvetica, arial, sans-serif; font-size: 13px; border-collapse: collapse; -webkit-border-horizontal-spacing: 2px; -webkit-border-vertical-spacing: 2px; ">
<span>by Gary W. Don, Karyn K. Muir, Gordon B. Volk, James S. Walker</span></div><div style="border-top-color: rgb(204, 204, 204); border-right-color: rgb(204, 204, 204); border-bottom-color: rgb(204, 204, 204); border-left-color: rgb(204, 204, 204); font-family: verdana, geneva, helvetica, arial, sans-serif; font-size: 13px; border-collapse: collapse; -webkit-border-horizontal-spacing: 2px; -webkit-border-vertical-spacing: 2px; ">
<span>Notices of the <font class="Apple-style-span" face="arial"><span class="Apple-style-span" style="border-collapse: separate; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; font-size: small;">American Math</span></font> Society, Jan 2010, Vol 57, Num.1 , pp. 30-49.</span></div>
<span class="Apple-style-span" style="font-family: verdana, geneva, helvetica, arial, sans-serif; font-size: 13px; border-collapse: collapse; -webkit-border-horizontal-spacing: 2px; -webkit-border-vertical-spacing: 2px; "><span></span></span><div style="border-top-color: rgb(204, 204, 204); border-right-color: rgb(204, 204, 204); border-bottom-color: rgb(204, 204, 204); border-left-color: rgb(204, 204, 204); font-family: verdana, geneva, helvetica, arial, sans-serif; font-size: 13px; border-collapse: collapse; -webkit-border-horizontal-spacing: 2px; -webkit-border-vertical-spacing: 2px; ">
<div class="url" style="border-top-color: rgb(204, 204, 204); border-right-color: rgb(204, 204, 204); border-bottom-color: rgb(204, 204, 204); border-left-color: rgb(204, 204, 204); color: rgb(0, 136, 0); max-width: 500px; white-space: nowrap; overflow-x: hidden; overflow-y: hidden; text-overflow: ellipsis; font-family: Arial; ">
<span class="Apple-style-span" style="color: rgb(0, 0, 0); font-family: arial; white-space: normal; font-size: small; "><a href="http://www.ams.org/notices/201001/rtx100100030p.pdf" target="_top" rel="nofollow" style="font-size: 1em; text-decoration: none; "><span>http://www.ams.org/notices/201001/rtx100100030p.pdf</span></a></span><span></span></div>
<span class="Apple-style-span" style="font-family: Arial; "><span></span></span></div><div style="border-top-color: rgb(204, 204, 204); border-right-color: rgb(204, 204, 204); border-bottom-color: rgb(204, 204, 204); border-left-color: rgb(204, 204, 204); font-family: verdana, geneva, helvetica, arial, sans-serif; font-size: 13px; border-collapse: collapse; -webkit-border-horizontal-spacing: 2px; -webkit-border-vertical-spacing: 2px; ">
<span><a href="http://www.uwec.edu/walkerjs/MBSGC/" target="_top" rel="nofollow" style="font-size: 1em; text-decoration: none; ">http://www.uwec.edu/walkerjs/MBSGC/</a></span></div></div>