pantera, en este mismo post, en la primera página, la última respuesta, tiene un par de links q te pueden ser de utilidad con respecto a las dudas q comentas en tú anterior post.
El ejemplo en labview realmente está lejos de estar optimizado, era una primera toma de contacto con el programilla en cuestión, de todas formas, por eliminar el frame cero no deberías obtener más velocidad, si acaso podrías tener algún problema en el caso de ejecutar el programa sin tener el dispositivo conectado... pero tampoco... es más algo purista que útil. Si va más rápido quizá sea por ese 'build array' q comentas, q relamente no se a q te refieres :S
Ten encuenta que cada vez q mandes algo en paquetes separados, se tendrán q abrir los pipes, enviar un paquete y cerrar los pipes, eso no es óptimo... una forma mejor de hacer esto sería, abrir pipes, enviar mediante un bucle for todos los paquetes (de 64bytes) q tengas q enviar y cerrar los pipes. Así ganaras algo de tiempo.
Otra forma para ganar o para optimizar la cosa es como comentan en el post ese que te digo (aún no lo he probado) engañando al micro para que reciba mas de 64bytes.
Por último hay otra forma y es hacerse uno su propio driver, ya q el de microchip está preparado para transmisión bulk y con un solo pipe, con lo cuál la velocidad máxima q se puede obtener está muy lejos de la velocidad teórica q debería poderse alcanzar. Espero pelearme un poco con este asunto en verano y hacer q el micro se despeine un poco! ahora tengo q acabar los examenes :p
saludos!