Post on 29-Sep-2018
ESCUELA POLITÉCNICA NACIONAL
ESCUELA DE INGENIERÍA
"CONTROL POR VOZ DE UN ROBOT EXPLORADOR TIPOORUGA"
PROYECTO PREVIO A LA OBTENCIÓN DEL TITULO DE INGENIERO ENELECTRÓNICA Y CONTROL
AREVALO LUZURIAGA MARCELO JAVIERPINO CHAVEZ MIGUEL ÁNGEL
DIRECTOR: ING. NELSON SOTOMAYOR
Quito, OCTUBRE 2004
Nosotros, MARCELO JAVIER AREVALO LUZURIAGA y MIGUEL ÁNGEL PINOCHAVEZ, declaramos bajo juramento que el trabajo aquí descrito es de nuestraautoría; que no ha sido previamente presentada para ningún grado o calificaciónprofesional; y, que hemos consultado las referencias bibliográficas que se incluyenen este documento.
A través de la presente declaración cedemos nuestros derechos de propiedadintelectual correspondientes a este trabajo, a la Escuela Politécnica Nacional, segúnlo establecido por la Ley de Propiedad Intelectual, por su Reglamento y por lanormatividad institucional vigente.
Javier Arévalo Ángel Pino
CERTIFICACIÓN
Certifico que e! presente trabajo fue desarrollado por MARCELO JAVIER AREVALOLUXURIAGA y MIGUEL ÁNGEL PINO CHAVEZ, bajo mi supervisión.
Ing. Nelscn Sotomayor
AGRADECIMIENTO
Primeramente a Dios por darme la salud para finalizar este proyecto, y regalarmesus bendiciones a cada instante, a mi esposa y compañera Anita que ha luchado ami lado en todo momento, a mi querido hijo Marcelito que es e! motor de mi vida ,a mis padres Mario y Margoth que me brindan todo su amor y apoyo, a missuegros Gonzalo y Magdalena que me han acompañado en los momentos masdifíciles, a mis hermanos Maribel, Maritza y Fernán que me dan su cariño y ayudaincondicional.
A todos los amigos que la vida ha puesto en mi camino que son muchos y muyvaliosos, al Laboratorio de Control Industrial en especial a! Ing. Ricardo Parreño unverdadero amigo, a Miguel Ángel mi copiloto en el proyecto y que es un amigomuy valioso, y por ultimo pero no menos importante al Ing. Nelson Sotomayor, porsu ayuda desinteresada y continua en el desarrollo del proyecto
DEDICATORIA
Con mucho cariño a la luz de mi vida, mi hijo MARCELÍTO JAVIER que es lapersona mas importante y mi motivación para vencer cualquier obstáculo,
A mi esposa Aníta, a mis padres, suegros, hermanos y a todos mis grandesamigos que nunca me han fallado y siguen siempre a mi lado.
MARCELO
AGRADECIMIENTO
A mi padre Dios, por todo lo que me a dado en la vida, la fuerza y tenacidad paraseguir adelante, a mis padres Luís y Luisa, que sin ellos este proyecto no sehubiera sido posible, a mis hermanos por su apoyo constante, a mí tío Marco y asu esposa por colaborarme siempre, a mis primos por creer constantemente enmí,
De manera muy especial a mi compañero y amigo Marcelo, que gracias a susinsistencias y empuje logramos culminar la carrera. A ti pequecita, que siempreestuviste allí con ese apoyo, en los momentos mas difíciles.
Al Ing. Nelson Sotomayor, por su ayuda desinteresada y acertada conducción enel desarrollo del proyecto. A todos mis amigos, compañeros de trabajo, y a todasesas personas que de una u otra forma colaboraron en la culminación de esteproyecto.
Al Ing. Ricardo Parreño, por brindarnos sus conocimientos y apoyo desinteresado.A todos mis tíos que de una u otra forma colaboraron en la culminación de micarrera.
Gracias a todos.
MIGUEL ÁNGEL
DEDICATORIA
Con mucho cariño a mis padres: Luís y Luisa, por ser los mejores padres quealguien puede pedir, por su amor, comprensión, apoyo y concejos que han hechode mí una mejor persona; y a la memoria de tres personas que ya no están masjunto a mi: Abuelita Dina, a mi primo Enrique y mi tía Melida. Descansen en paz
MIGUEL ÁNGEL
CONTENIDO
CONTENIDO i
RESUMEN...................................... iv
PRESENTACIÓN.! vi
1.1 FUNDAMENTOS BÁSICOS SOBRE EL RECONOCIMIENTO DE VOZ .... 1
1.1.1 RECONOCIMIENTO DE VOZ AUTOMÁTICO 1
1.1.2 SISTEMAS DE RECONOCIMIENTO DEPENDIENTES,INDEPENDIENTES Y ADAPTABLES AL HABLANTE 2
1.1.3 TRATAMIENTO DEL HABLA.......
1.1.4 RECONOCIMIENTOS LA VOZ
1.1.5 KIT DE RECONOCIMIENTO AUTOMÁTICO DE VOZ "VOI CEDÍRECTir..... 9
1.1.6 ENTRENAMIENTO DEL MODULO DE RECONOCIMIENTO DEVOZ............. 13
1.1.7 RECONOCIMIENTO DE LAS PALABRAS EN EL MODULO........ 20
1.2 FUNDAMENTOS BÁSICOS SOBRE EL FUNCIONAMIENTO DE LOSSENSORES DE PROXIMIDAD 24
1.2.1 SENSORES DE PROXIMIDAD DE FIN DE CARRERA. 24
1.2.2 SENSORES DE PROXIMIDAD POR MEDIO DE ULTRASONIDO 25
1.2.3 SENSORES DE PROXIMIDAD CON LUZ INFRAROJA 26
1.2.4 SENSORES DE VIDEO. 28
1.3 PROPOTIPOS YA IMPLEMENTADOS QUE UTILIZAN SISTEMAS DEVIDEO 29
CAPITULO 2
2 DISEÑO DESARROLLO E IMPLEMENTACION DELHARDWARE
2.1 FUNCIONAMIENTO GENERAL 33
2.2 REQUERIMIENTOS MECÁNICOS.......... 34
2.2.1 IMPLEMENTACION DE VEHÍCULO MOTORIZADO TIPO ORUGA.... 34
2.2.2 CÁMARA MÓVIL 36
2.2.3 IMPLEMENTACION PINZA PARA SUJETAR OBJETOS 37
2.3 REQUERIMIENTOS ELÉCTRICOS Y ELECTRÓNICOS 38
2.3.1 DISEÑO DE TARJETA MADRE DE CONTROL 39
2.3.2 IMPLEMENTACION DEL CONTROL POR VOZ................ 43
2.3.3 DISEÑO DE SENSORES INFRARROJOS DE PROXIMIDAD 45
2.3.4 IMPLEMENTACION DEL TRANSMISOR DE AUDIO Y VIDEO PARALA CÁMARA 46
2.3.5 IMPLEMENTACION DEL TRANSMISOR DE AUDIO Y VIDEO PARALA CÁMARA 47
2.3.6 IMPLEMENTACION DEL TRANSMISOR DE AUDIO 49
2.3.7 DISEÑO DE CIRCUITO CONTROLADOR DE SERVOMOTORES 50
2.3.8 IMPLEMENTACION DEL TRASMISOR DE DATOS 52
2.3.9 RECARGA DE BATERÍAS... 52
2.3.10 ENSAMBLAJE DEL ROBOT EXPLORADOR TIPO ORUGA 55
2.3.11 FUNCIONAMIENTO DEL ROBOT TIPO ORUGA.. 66
CAPITULO 3
3 DISEÑO DESAEROLLO DEL SOFTWARE
3.1 GENERALIDADES... - 723.2 PROGRAMACIÓN DEL MICROCONTROLADOR PIC16F876.... 73
3.2.1 DESARROLLO DEL FLUJOGRAMA GENERAL DEPROGRAMACIÓN 74
3.3 ESTRUCTURA DEL SOFTWARE PARA MANEJO DE PERIFÉRICOS DEENTRADA Y SALIDA.. 85
CAPITULO 4
4 PRUEBAS Y RESULTADOS
4.1 PRUEBAS........... 864.2 RESULTADOS....... 904.3 LISTADO DE ELEMENTOS Y COSTO 94
CAPITULO 5
5 CONCLUCIONES Y RECOMENDACIONES
5.1 CONCLUSIONES Y RECOMENDACIONES. 99
REFERENCIAS BIBLIOGRÁFICAS 102
ANEXOS 103
RESUMEN
El siguiente proyecto de titilación presenta el diseño y construcción de un robot
explorador tipo oruga controlado mediante comandos de voz, el cual basa su
funcionamiento en un microcontrolador PIC 16F876 y un kit de reconocimiento
de voz como interfaz entre el usuario y el mismo.
Dicho prototipo cuenta con un chasis tipo oruga con tracción diferencial que le
permite una locomoción adaptable a cualquier terreno. De igual manera cuenta
con una cámara infrarroja, la cual envía una señal medíante un transmisor UHF
de audio y video implementado en el robot, hacia un receptor remoto o televisor
común, todo de manera inalámbrica.
El robot posee también una pinza en su parte posterior, la misma que íe
permite recolectar pequeños objetos y trasladarlos de un lugar a otro. A todo
esto le sumamos un conjunto de 9 sensores infrarrojos que le ayudan al
prototipo a realizar una exploración automática, evadiendo obstáculos y
abismos durante toda su trayectoria.
Por último se señala que el robot explorador tipo oruga es capaz de realizar 18
acciones diferentes de control con 15 comandos de voz, los cuales deberán ser
ingresados previamente por el usuario y luego enviados por medio de un
micrófono inalámbrico.
IV
PRESENTACIÓN
En el siglo XXI la tecnología se ha adelantado a la imaginación y ha convertido
lo que eran sueños en algo posible y de hecho el control por voz es en la
actualidad una área en evolución que no se ha desarrollado aun en el país, por
lo que este proyecto plantea como alcance el de ser el pionero en investigar y
aplicar este tipo de control en la vida diaria de las personas, con este prototipo
se quiere conseguir e iniciar el desarrollo de esta tecnología en e! Ecuador.
Dentro de la robótica existen un sin numero de dispositivos electrónicos
capaces de realizar acciones y movimientos definidos. Para gobernar a estos
dispositivos se necesita de un elemento inteligente programable que permita
administrar y controlar todas estas acciones y movimientos. En este caso el
prototipo trabaja con un microcontrolador PIC 16F876 por su facilidad en la
programación y bajo costo ofrece todo lo necesario para realizar el control del
mismo.
Como ínterfaz entre el usuario y el microcontrolador se utiliza un kit de
reconocimiento de voz, donde se programan previamente las ordenes
(palabras) que son almacenadas en localidades de memoria y al recibir
cualquiera de las instrucciones enviadas por el usuario, éste compara con la
señal almacenada, y envía un dato como señal de control hacia el
microcontrolador PIC, que por su parte es eí encargado de administrar y
controlar todos los actuadores que intervienen en el cumplimiento de dicha
orden. Dentro de estas ordenes esta la de exploración deforma autónoma en
la que el prototipo evadirá obstáculos en su trayectoria automáticamente
usando para esto los sensores infrarrojos con el circuito integrado Sharp
IS471F el cual transmitirá una señal al microcontroíador en el momento que
encuentre un obstáculo en la trayectoria del robot.
Este reporte consta de 5 capítulos, el primer capítulo presenta los
fundamentos básicos de funcionamiento y control que realizan todos los
elementos programables que intervienen en el prototipo, además se hablará
v
de los sensores y actuadores que permiten realizar el control con todas sus
características y condiciones de funcionamiento y justificando la selección de
los elementos.
En el capitulo segundo comprende el diseño del hardware y de la ubicación
física que este tiene dentro de! prototipo, con todos los requerimientos
propuestos en el proyecto. En el capitulo tercero por su parte se encuentra el
desarrollo del software y los criterios con los que se realizó la programación
para conseguir los mejores resultados.
El capitulo cuarto presenta las pruebas desarrolladas con el prototipo y los
resultados obtenidos de las mismas.
Por ultimo se tiene el capitulo quinto que presentara las conclusiones que se
han generado del trabajo realizado durante todo el proceso de construcción del
prototipo, aclarando las partes del mismo que pueden ser aplicadas a futuros
proyectos por sus óptimos resultados, las etapas que pueden ser mejoradas
por futuras generaciones, y las partes que deberán ser desarrolladas de
manera diferente para lograr mejores resultados.
"VI
CAPITULO 1
1 FUNDAMENTOS TEÓRICOS
1.1 FUNDAMENTOS BÁSICOS SOBRE EL RECONOCIMIENTO
DE VOZ
En un futuro cercano, el reconocimiento de la voz se convertirá en el método
más usado para realizar el control de todas las actividades cotidianas que realiza
el hombre que van desde las más simples y usuales como encender las luces de
la casa, hasta las más complejas e inimaginables, como realizar cirugías con
instrucciones de voz; de hecho en los países del primer mundo el reconocimiento
de voz ya es aplicado para labores dentro de las industrias como manejo de
maquinarias, edificios inteligentes, control de vehículos, etc.
En este capitulo se introduce los tipos de reconocimiento de voz que existen hasta
la actualidad y como funcionan los mismos para conseguir lo que hace años era
solo un sueño el de poder comunicarnos con las máquinas por medio de señales
audibles. Las máquinas por si solas no son capaces de reconocer la voz, mas sí
estas están conectadas a un elemento "inteligente" todo es posible.
1.1.1 RECONOCIMIENTO DE VOZ AUTOMÁTICO
El reconocimiento de voz automático es el proceso por el cual un computador
convierte una señal acústica de voz a texto. La comprensión automática del
lenguaje es el proceso por el cual un computador convierte una señal acústica de
voz en alguna forma de expresión abstracta del lenguaje.
1.1.2 SISTEMAS DE RECONOCIMIENTO DEPENDIENTES,
INDEPENDIENTES Y ADAPTABLES AL HABLANTE
Un sistema dependiente del hablante es desarrollado para funcionar para un sólo
hablante, estos sistemas, normalmente, son más fáciles de desarrollar, baratos
de comprar, y precisos, pero no tan flexibles como los sistemas adaptables al
hablante o los sistemas independientes del hablante.
Un sistema independiente del hablante es desarrollado para funcionar con
cualquier hablante de un determinado tipo (por ejemplo, Inglés Americano). Estos
sistemas son complicados de desarrollar, caros y la precisión es menor que la
de los sistemas dependientes del hablante; sin embargo son más flexibles.
Un sistema adaptable al hablante es desarrollado para adecuar su
funcionamiento a las características de nuevos hablantes. Su dificultad reside en
alguna zona entre los sistemas independientes del hablante y los dependientes
de él, [1]
1.1.2.1 Vocabulario pequeño, mediano, grande, muy grande
El tamaño del vocabulario de un sistema de reconocimiento de voz afecta a su
complejidad, requerimientos de proceso y precisión del sistema.
Algunas aplicaciones sólo requieren unas pocas palabras (por ejemplo,
únicamente cifras), otros requieren diccionarios enormes (por ejemplo, máquinas
de dictado). No hay definiciones establecidas, sin embargo se suele utilizar la
siguiente clasificación:
• vocabulario pequeño - decenas de palabras
• vocabulario mediano - cientos de palabras
• vocabulario grande - miles de palabras
• vocabulario muy grande - decenas de miles de palabras
1.1.2.2 Reconocimiento continuo y discreto
Un sistema de reconocimiento discreto funciona con palabras simples,
necesitando de una pausa entre la dicción de cada palabra. Esta es la forma más
sencilla de reconocimiento para llevar a cabo ya que los puntos de finalización
son fáciles de encontrar y la pronunciación de una palabra no afecta a las demás.
De este modo, y ya que las ocurrencias de las palabras son consistentes, es más
fácil reconocerlas.
Un sistema de reconocimiento continuo funciona sobre un lenguaje en el que las
palabras están conectadas, es decir, no están separadas por pausas. El lenguaje
continuo es más difícil de tratar debido a la variedad de efectos, primero, es difícil
encontrar el comienzo y el final de las palabras, otro problema es la
coarticulacíón, la generación de cada fonema se ve afectada por la generación de
los fonemas adyacentes, y de modo parecido, el comienzo y final de las palabras
se ven afectados por las palabras que íes preceden y suceden. El reconocimiento
del lenguaje continuo también se ve condicionado por la frecuencia de habla (un
discurso rápido suele ser más difícil de reconocer). [2]
1.1.23 Técnicas de reconocimiento
Se utilizan una gran variedad de técnicas para llevar a cabo el reconocimiento de
voz, y a su vez hay diversos tipos de análisis y comprensión.
Típicamente el reconocimiento comienza con el muestreo digital de la voz, el
siguiente paso es el proceso de la señal acústica. Las técnicas más
frecuentes incluyen el análisis espectral; por ejemplo, análisis LPC (Linear
Predictive Coding, codificación lineal predictiva), MFCC (Mel Frequency Cepstral
Coefficíents), y otras.[3]
El siguiente paso es el reconocimiento de fonemas, grupos de fonemas y
palabras. Este paso puede ejecutarse de varias formas, mediante DTW (Dynamic
Time Warping), HMM (Hidden Markov Modelling), NNs (Neural Networks, redes
neudonales), sistemas expertos y combinación de técnicas. Actualmente los
sistemas basados en HMMs son los más frecuentemente utilizados y la
aproximación más exitosa.
La mayoría de los sistemas se ayudan de algún tipo de conocimiento sobre el
lenguaje para ayudar al proceso de reconocimiento.
1.1.2.4 Reconocimiento del hablante (verificación y validación)
El reconocimiento del hablante es el proceso de reconocer automáticamente
quién está hablando en base a información individual incluida en las señales del
lenguaje. Pueden dividirse en identificación y verificación del hablante. La
identificación del hablante determina cuál de los hablantes registrados
proporciona un patrón dado de entre un grupo de hablantes conocidos. La
verificación del hablante acepta o rechaza la petición de identidad del hablante.
¿Es el hablante la persona que dice que es?
La tecnología de reconocimiento del hablante hace posible que la voz de un
hablante controle el acceso a servicios restringidos, por ejemplo, acceso
telefónico a la banca, servicios de base de datos, compras o correo de voz, y
acceso a material seguro.
Ambas tecnologías requieren que el usuario se registre en el sistema, es decir,
que de ejemplos de su lenguaje al sistema de modo que este pueda caracterizar o
aprender su patrón de voz. [4]
1.1.3 TRATAMIENTO DEL HABLA
Se entiende como tratamiento de la palabra al conjunto de disciplinas que
estudian la manera de trasladar la forma de comunicación que se conoce como el
lenguaje hablado hacia las máquinas.
El Tratamiento de la palabra esta dividido entres partes importantes;
• Síntesis
• Codificación
• Reconocimiento
1.1.3.1 Síntesis de la señal vocal
Viene a ser la creación de señal vocal sintética, se desea que una máquina sea
capaz de expresarse emitiendo sonidos que se pueda entender como palabras
u oraciones. Esto conlleva a la comprensión total del proceso del habla, implica la
interacción de disciplinas en las que están incluidas la fisiología del órgano
humano así como también la lingüística.[5]
1.1.3.2 Codificación
La computadora debe ser capaz de procesar la información de tal forma que le
permita disponer de la posibilidad de almacenar señal vocal de una forma
eficiente y así comprimir la señal y/o transmitirla por un medio de ancho de
banda limitado.
1.1.3.3 Reconocimiento
Tal vez esta es la parte más complicada del tratamiento de la palabra, hacer
posible que la computadora sea capaz de escuchar y reconocer las palabras
emitidas por una persona. Involucra el desarrollo de algoritmos que sean capaces
de realizar la comparación de patrones de voz entre palabras pronunciadas y las
palabras de un diccionario predeterminado
1.1.4 RECONOCEVUENTO DE LA VOZ
El reconocimiento de la voz constituye una parte importante del tratamiento def
habla. Las técnicas de reconocimiento más desarrolladas son aquellas
comúnmente usadas para el idioma inglés las cuales incluyen el Análisis de
Predicción Lineal (LPC) y el Alineamiento Temporal (DTW), estos algoritmos han
tenido éxito habiendo sido sometidos a pruebas bajo diversos ambientes.[6]
Debe tenerse en cuenta la importancia de desarrollar estas técnicas para el
idioma español pues las características lingüísticas difieren en forma marcada
cuando se requiera llevar hacia un reconocimiento más completo. El enfoque que
se ha dado en un principio ha sido el reconocer palabras aisladas, es decir que
las palabras se pronuncian entre pausas pequeñas de tal forma que el
procesamiento se realiza teniendo como unidades lingüísticas las palabras de un
vocabulario específico. Las unidades lingüísticas de cualquier idioma vienen a ser
más bien los fonemas y los dífonos por lo tanto un enfoque en este sentido seria
tal vez más apropiado si es que se desea llegar a vocabularios extensos. Sin
embargo el desarrollo aquí descrito puede considerarse en aplicaciones donde el
vocabulario no exceda de 50 palabras.
1.1.4.1 Naturaleza de la señal vocal
El análisis de la señal vocal se lleva cabo medíante un modelo que describe el
proceso del habla clasificando las señales en dos tipos:
« Las señales sonoras que se caracterizan por tener alta energía y contenido
frecuencial en el rango de los 300 Hz a 4 KHz las cuales se generan por
intermedio de las cuerdas vocales y además presentan cierta periodicidad
como se muestra en la Figura 1.1
Figura 1.1 Señal sonora
Las señales no sonoras también conocidas como fricativas se caracterizan
por tener baja energía y espectro de frecuencia uniforme presentando
contaminación de ruido blanco como se muestra en la Figura 1.2
-^^II ' ' *Vlh\rt\ r|
Figura 1.2 Señal no sonora
Es así como la señal, dividida en dos partes, se modela como dos fuentes de
excitación que alimentan al sistema acústico que conforma el tracto vocal.
1.1.4.2 Modelado del tracto vocal
El modelado del tracto vocal se manifiesta como un filtro variable en el tiempo
cuyos parámetros varían de igual manera en función de ía acción consciente
que se realiza al pronunciar una palabra.
Ei filtro variable en el tiempo tiene dos posibles señales de entrada que
dependerán del tipo de señal, sonora o no sonora. Para señales sonoras la
excitación será un tren de impulsos de frecuencia controlada, mientras que para
las señales no sonoras la excitación será ruido blanco.
El espectro de frecuencia de la señal vocal puede obtenerse a partir del producto
del espectro de ía excitación por la repuesta en frecuencia deí filtro.
El tracto vocal manifiesta un número muy grande de resonancias, sin embargo se
consideran solo las tres o cuatro primeras que toman el nombre de 'formantes' y
cubren un rango de -frecuencias entre TOOhz y 3,5 khz. Esto debido a que las
resonancias de alta frecuencia son atenuadas por ía característica frecuencia! deí
tracto que tiende a actuar como un filtro pasabajo con una caída de
aproximadamente -12 dB por octava.
Este modelo es una simplificación del proceso deí había. Los son idos fricativos no
se filtran por el tracto con la misma extensión en que lo hacen las señales sonoras
por ío que el modelo no es muy preciso para este tipo de señales. Además el
modelo supone que las dos señales pueden separarse sin considerar ninguna
interacción entre ellas, lo cual no es cierto ya que ía vibración de cuerdas vocales
es afectada por (as ondas de presión dentro deí tracto. Sin embargo estas
consideraciones pueden ser ignoradas resuítando el modelo lo suficientemente
adecuado. [7]
TONO:FUNDAMENTAL
GENERADOSDEJMPÜLSOS
PARÁMETROSDEL TRACTO
VOCAL
\} r
- '
PILTRO VARIABLEEN EL TIEMPO
voz
Figura 1.3 Modelo del tracto vocal
El kit posee dos modos de funcionamiento:
. El modo de ENTRENAMIENTO: permite grabar las palabras que
deberán ser reconocidas y que además no podrán ser fonéticamente
similares porque esto podrá ocasionar un conflicto y una mala
respuesta de reconocimiento; el tiempo de duración estimado para
cada palabra es de 2 segundos y la capacidad de palabras vana de
10
acuerdo con el modo de reconocimiento que se quiera tener
(dependiente e independiente),
• El modo de ESCUCHAR CONTINUO es el que permite realizar e!
reconocimiento mismo de las palabras y permite siempre estar alerta de
la palabra ingresada al kit. Únicamente en este modo se podrá tener
señales de salida,
1.1.5.1 Características delKít
Este kit cuenta con una entrada de micrófono y una salida de parlante. La entrada
de micrófono permitirá que se le adiestre al sistema con las palabras que serán
reconocidas, mientras que el padante emitirá el numero de la posición en el cual
se encuentra ubicada la palabra reconocida. Este kit tiene la capacidad de
reconocer hasta 60 palabras en modo esclavo, y 15 palabras en modo stand
alone que puede estar dividido en 3 set de 5 palabras. Lo que permitiría construir
bancos de 5 palabras, es decir brindaría 15 señales de control con 15 palabras
reconocidas. Las palabras tendrán una duración de 2 seg. Siendo de fácil
adaptación para el instructor.
RSC-300/364Watchdqg
Tímer
\fQ PropositoGenera!
MemoriaExterna
Figura 1.4 Esquema del kií de reconocimiento de voz
1.1.5.2 El RSC 300
11
*- o<1 -^
* - c v f O - = - w < O r > S -5o o a a p o a f i - 5 -
UJ
-tO ?5Q K*
3 * a £
A5E
A3[
^.......0.--»
3
4
56
7
8 RSC-300/3640 (64-lead TQFP}10
11
12
13
14
15
18l ^ £ £ $ í 8 í N P i ? 3 r t o i 8 & 8 8
47
46
45
44
4342
41
40
39
36
37
38
35
34
338 *" £í
«1PDN
|GND
O tft ~^ t^
O. O- D, CL
*" O t^ <O tíl•r- »- O o Oa a, ÍC a &
Figura 1.5 Esquema físico del mícrocontrolador RSC - 300
Este chip es utilizado para el reconocimiento de voz, como se puede observar en
el la Figura 1.5 cuenta con: conversores analógicos digitales, 2 señales de salida
tipo PWM, bus de datos y bus de direcciones de 64k y 2 puertos, PO y P1. Es
especialmente utilizado para el reconocimiento y reproducción de voz. Tiene una
gran similitud con el microcontrolador 8051 de Intel, además su set de
instrucciones (51 instrucciones) son similares y de igual uso que el
microcontrolador antes mencionado. [9]
1.1.5.3 Montaje de kit
En el montaje del kit se debe tomar muy en cuenta el lugar y la forma como se lo
va a ubicar, así el kit debe contar con una alimentación de 5 voltios o de 3
baterías de 1.5 V, para mayor seguridad conectar un diodo en serie antes de la
12
entrada al sistema, de esta forma se protegerá de polarizaciones invertidas.
Además se debe tomar en cuenta los elementos extemos que van a estar
conectados, es decir, motores, osciladores externos, etc. Que afectaran a! kit en
su trabajo normal. Se tiene que tomar en cuenta la conexión de alimentación y
del parlante, estas deben estar colocadas de forma opuesta. Para evitar
problemas de reflejo electromagnético.
Otra condición del kit de reconocimiento de voz es que, las salidas tienen un
tiempo de 1 segundo en alto para reconocer la señal de control, por lo que será
necesario la instalación de un LATCH, el mismo que permitirá tener el dato
enviado por el kit, por más tiempo. Al momento de encender el sistema, este
tendrá las salidas en 1 lógico por alrededor de un segundo, característica que
puede afectar al resto de! sistema. Por esta razón el LATCH deberá ser habilitado
íuego de por lo menos 1 segundo de ser energizado el kit evitándose así cualquier
Falsa señal hacia el controiador principal.
1.1.5.4 Modos de operación
Dependiendo de cómo se origine las señales los modos de reconocimientos son:
• Dependiente del parlante (SD)
• Escuchando continuamente (CL)
Hay dos tipos de modo escuchando continuamente, palabra simple y palabra
múltiple.
Existen 3 pines de selección y actuación:
• Entrenamiento (TRAIN)
• Entrenamiento CL (CLTRAIN)
• Reconocimiento (RECOG)
13
Estos pines serán accionados cuando el kit sea peseteado, así cuando se desee
cambiar de modo será necesario resetear o apagar e! módulo y de esta forma el
kit sabrá en que modo nuevo debe trabajar.
Tabla 1.1 Configuración de Pines
PIN
TRAIN
Circuito abierto
TRAIN a tierra con
R = 100Kohmios
CLTRAIN
A tierra con
R = 47kohmios
CLTRAIN
A tierra con
R = 680kohmios
RECOG
Circuito abierto
RECOG a tierra
R = 100Kohmios
TRABAJO
Entrenamiento SD relajado, más fácil de entrenar,
de sonidos similares
Entrenamiento SD estricto, más difícil de entrenar
similares, pero el reconocimiento es más exacto
no acepta palabras
no acepta sonido
Entrenamiento CL relajado
Entrenamiento estricto
Reconocimiento relajado SD CL, reconoce más palabras equivocadas
Reconocimiento estricto CL SD, reconoce menos
despreciar palabras entrenadas
palabras y podría
De acuerdo a esta tabla tanto el modo SD como el modo CL pueden trabajar con
niveles de exactitud denominados "relajado" y "estricto" donde dependiendo de la
aplicación serán de menor o mayor utilidad. Teniendo en cuenta que mientras
mayor exactitud en el reconocimiento de la palabra se requiera mayor será el
tiempo de respuesta del sistema para cualquiera de los dos modos. [10]
1.1.6 ENTRENAMIENTO DEL MODULO DE RECONOCIMIENTO DE VOZ
1.1.6.1 Modo SD
Para el entrenamiento en este modo el kit deberá ser configurado como tal,
cuando el pin de entrenamiento sea llevado a tierra por más de 10 mseg. El
entrenamiento comenzará, entonces, el Voice Direct iniciará el proceso de
14
entrenamiento diciendo," say word X" donde X es el número de la palabra o frase
a ser entrenada, ía cual como se anota anteriormente no deberá ser mayor a 2
segundos y no podrá tener silencios mayores a 0.5 segundo.
Existen 4 razones por las cuales eí entrenamiento terminará, estas se citan a
continuación;
• Si no se responde con una palabra en el momento que el módulo lo
requiera (tiempo máximo de espera del modulo 3 segundos).
• Cuando e! pin de entrenamiento es presionado una segunda vez durante el
proceso adiestramiento.
• Cuando tres errores concurrieran durante el proceso de entrenamiento,
siendo considerados como errores palabras fonéticamente similares,
palabras con recepción de mala calidad, palabras demasiado largas.
• O simplemente cuando todas las palabras ya han sido entrenadas.
Para volver al modo de entrenamiento o reentrenar al módulo es necesario llevar
al pin de entrenamiento a tierra por más de 100 milisegundos. Si el módulo ya ha
sido entrenado con todas las palabras ingresará a un modo de reentrenamiento
caso contrario entrenara las palabras faltantes para completar el set de 15
instrucciones.
El módulo no permitirá realizar el borrado de una palabra independientemente de
la otras, la única posibilidad que presta es la de borrar en conjunto todo el set de
15 instrucciones.
i
MODO DE OPERACIÓN SD
Botón dereconocimientode palabra
Figura 1.6 Operación en modo SD
Luego de haber ingresado la primera palabra al módulo este dirá "repeat",
entonces se deberá ingresar nuevamente la palabra. Y si la misma es aceptada el
Voice Direct II continuará diciendo "say word X+1". Si la palabra no fue aceptada
por el módulo este dará un mensaje causal de error y la salida o pin de error se
pondrá en alto por un segundo. El usuario tiene 3 intentos para ingresar la palabra
antes de que el módulo salga del modo de entrenamiento. Así mismo e! usuario
podrá salir de este modo en cualquier momento llevando el pin de entrenamiento
a tierra o llevando el pin de reconocimiento también a tierra.
16
Tabla 1.2 Ejemplo de entrenamiento en modo SD
ACCIÓN
Voice Direct II:
Usuario:
Voice Direct II:
Usuario:
Voice Direct II:
Usuario:
Voíce Direct II:
Usuario:
Voice Direct II:
Usuario:
Voice Direct I i:
Usuario:
ACCIÓN
PRESIONAR BOTÓN ENTRENAMIENTO
"Say word one"
"encender"
"Repeat"
"encender"
"Say word two"
"apagar"
"Repeat"
"apagar"
"Say word Three"
"luces"
"Repeat"
"luces"
PRESIONAR BOTÓN ENTRENAMIENTO
INICIO DEENTRENAMIENTO
Entrenando palabra SD 1
Entrenando palabra SD 2
Entrenando palabra SD 3
PARA ENTRENAMIENTO
1.1.6,2 Modo CL de palabra simple
En este modo de entrenamiento será necesario utilizar 2 pines, el pin de
entrenamiento y eí pin de entrenamiento CD. Este modo permite que e! usuario
tenga una palabra de inicio para el reconocimiento de las 15 instrucciones. Para
iniciar el entrenamiento CL por más de 100 mili segundos seguidamente el kít de
conocimiento de voz, pedirá que se ingrese la palabra de entrenamiento CL. Una
vez aceptada esta palabra se deberá llevar el pin de entrenamiento a tierra e
ingresar la palabra de entrenamiento SD; para entrenar una nueva palabra SD se
debe tomar en cuenta que el pin de entrenamiento nuevamente sea llevado a
tierra.
17
OPERACIÓN EN MODOSIMPLE PALABRA. PALABRA SD1
PALABRA SD
PALABRA SD 3
Figura 1.7 Operación en modo CL de simple palabra
Tabla1.3 Ejemplo de entrenamiento en modo CL de simple palabra
ACCIÓNVoice Direct II:
Usuario:
Voice Direct 11:
Usuario:
ACCIÓN
Voice Direct II:
Usuario:
Voice Direcí II:
Usuario:
ACCIÓN
Voice Direct II:
Usuario:
PRESIONAR BOTÓN ENTRENAMIENTOCL
"Say word one"
"sistema"
"Repeat"
"sistema"
PRESIONAR BOTÓN ENTRENAMIENTOSD
"Say word one"
"encender"
"Repeat"
"encender"
PRESIONAR BOTÓN ENTRENAMIENTOSD
"Say word two"
"apagar11
INICIO DE ENTRENAMIENTOCL
Entrenando palabra CL
INICIO DE ENTRENAMIENTOSD
Entrenando palabra SD 1en e) set
INICIO DE ENTRENAMIENTOSD
Entrenando palabra SD 2en el set
Voice Direct II:
Usuario:
ACCIÓN
Voice Direct II:
Usuario:
Voice Direct II:
Usuario:
"Repeat"
"apagar"
PRESIONAR BOTÓN ENTRENAMIENTOSD
"SaywordThree"
"luces"
"Repeat"
"luces"
INICIO DE ENTRENAMIENTOSD
Entrenando palabra SD 3en el seí
1.1.6.3 Modo CL de múltiple palabra
La secuencia de entrenamiento en este modo es similar a la del modo de
entrenamiento CL de simple palabra con la única diferencia de que en este caso
se tiene la posibilidad de ingresar 3 palabras CL, después de cada una de las
cuales se pueden entrenar hasta 5 palabras CL, formando 3 set de 5 palabras SD
cada una.
Una de las precauciones que hay que tener en cuenta en este modo de
entrenamiento es que lastres palabras CL deberán ser fonéticamente diferentes y
preferentemente de diferente número de silabas. La similitud de las palabras SD
no tendrá importancia si se produce en diferentes sets de entrenamiento ya que,
el módulo es este modo verificará similitud de las palabras SD solamente dentro
de cada set de 5 palabras.
19
MODO DE OPERACIÓN CLMULTIPALABRA
PALABRA CL1
PALABRA CL
PALABRA CL3
Fígura1.8 Operación en modo CL de múltiple palabra
Tabla1.4 Ejemplo de entrenamiento en modo CL de múltiple palabra
ACCIÓN
Voice Dírect II:
Usuario:
Voice Direct U:
Usuario:
ACCIÓN
Voice Direct II:
Usuario:
Voice Direcí II:
Usuario:
ACCIÓN
Voice Direct II:
Usuario:
PRESIONAR BOTÓN ENTRENAMIENTOCL
"Say word one"
"sistema"
"Repeat"
"sistema"
PRESIONAR BOTÓN ENTRENAMIENTOSD
"Say word one"
"encender"
"Repeaí"
"encender"
PRESIONAR BOTÓN ENTRENAMIENTOSD
"Say word two"
"apagar"
INICIO DE ENTRENAMIENTOCL
Entrenando palabra CL delprimer seí
INICIO DE ENTRENAMIENTOSD
Entrenando palabra SD 1en el set 1
INICIO DE ENTRENAMIENTOSD
Entrenando palabra SD 2en el sel 1
20
Voice Direct 11:
Usuario:
ACCIÓN
Voice Direct II:
Usuario:
Voice Direct II:
Usuario:
ACCIÓNVoice Direct II:
Usuario:
Voice Direct II:
Usuario;
"Repeat"
"apagar"
PRESIONAR BOTÓN ENTRENAMIENTOSD
"Say word Three"
"luces"
"Repeat"
"luces"
PRESIONAR BOTÓN ENTRENAMIENTOCL
"Say word one"
"sistema"
"Repeat"
"sistema"
INICIO DE ENTRENAMIENTOSD
Entrenando palabra SD 3en el set 1
INICIO DE ENTRENAMIENTOCL
Entrenando palabra CL delsegundo set
1.1.7 RECONOCIMIENTO DE LAS PALABRAS EN EL MODULO
1.1.7.1 Modo SD
Para realizar el reconocimiento en este modo se deberá llevar el pin de
reconocimiento a tierra por al menos 100 [ms]. El reconocimiento empezará
cuando el módulo diga "say a word", si la respuesta dada por el usuario no es
reconocida el Voice Direct dirá "word not reconoízed", y automáticamente saldrá
del modo de reconocimiento. Por el contrario si concuerda con una de las
palabras entrenadas uno o dos de los 8 pines de salida se activará y un mensaje
de voz indicara la respuesta concordante.
Si el conjunto contiene 8 o menos elementos de reconocimiento las salidas serán
directas caso contrario deberán ser codificadas.
21
Para cada palabra SD que el módulo deberá reconocer, el chip monitoreará el
nivel de ruido de fondo, y dará una alerta de voz si el ruido es demasiado alto
como para reconocer una palabra. Cave señalar que el Voice Direct II trabaja bien
con altos niveles de ruido de fondo estables, por encima de los 80 dB pero puede
presentar errores si el ruido no es estable.
Tabla 1,5 Salidas de control del módulo en modo SD
RECONOCIMIENTODE PALABRA
PALABRA 01 SD
PALABRA 02 SD
PALABRA 03 SD
PALABRA 04 SD
PALABRA 05 SD
PALABRA 06 SD
PALABRA 07 SD
PALABRA 08 SD
PALABRA 09 SD
PALABRA 10SD
PALABRA 1 1 SD
PALABRA 12 SD
PALABRA 1 3 SD
PALABRA 1 4 SD
PALABRA 1 5 SD
SAL1
A
A
SAL2
A
A
SAL3
A
A
SAL4
A
A
SAL5
A
A
SAL6
A
A
SAL7
A
A
SAL8
A
A
A
.A
A
A
A
ANota: la letra "A" indica que la salida esta activa.
1.1.7.2 Modo CL de simple palabra
De igual manera que en el modo anterior el pin de reconocimiento deberá ser
llevado a tierra para que el proceso se inicie, e! cual requerirá que el usuario
ingrese la palabra CL únicamente, caso contrario se producirá un error y el
módulo se saldrá de este modo. Si la palabra CL fue ingresada con éxito se abrirá
una ventana de espera de 3 segundos para ingresar cualquiera de las palabras
SD entrenadas, de igual manera, de no tener éxito con la palabra SD se producirá
un error y automáticamente se saldrá de este modo.
Tabla 1.7 Salidas de control del módulo en modo CL de múltiple palabra
PALABRA CL
PALABRA CL
A
PALABRA CL
A
PALABRA CL
A
PALABRA CL
A
PALABRA CL
A
PALABRA CL
B
PALABRA CL
B
PALABRA CL
B
PALABRA CL
B
PALABRA CL
B
PALABRA CL
C
PALABRA CL
C
PALABRA CL
C
PALABRA CL
C
PALABRA CL
C
PALABRA SD
PALABRA -SD
1
PALABRA SD
2
PALABRA SD
3
PALABRA SD
4
PALABRA SD
5
PALABRA SD
1
PALABRA SD
2
PALABRA SD
3
PALABRA SD
4
PALABRA SD
5
PALABRASD
1
PALABRA SD
2
PALABRA SD
3
PALABRA SD
4
PALABRA SD
5
SAL1
A
A
A
A
A
SAL2
A
A
A
A
A
SAL3
A
A
A
A
A
SAL4
A
A
A
SAL5
A
A
A
SAL6
A
A
A
SAL7
A
A
A
SAL8
A
A
A
Nota; la letra "A" indica que la salida esta activa.
24
1.1.7.4 Borrado de las plantillas
Para realizar el borrado de fas instrucciones entrenadas en el módulo se debe
llevar a tierra ambos pines el de entrenamiento y el de reconocimiento por más de
100 milisegundos; luego de lo cual el Voíce Direct II dirá "Memory Erased",
además e! pin de error se activara por un segundo, cabe señalar que no se puede
realizar el borrado de palabras individuales.
1.2 MJNDAMENTOS BÁSICOS SOBRE EL EÜNCiONAMÍENTO
DE LOS SENSORES DE PROXIMIDAD
Tal como una persona necesita de sus sentidos para guiarse, un mecanismo
robótico necesita de sensores para saber en donde esta. Así en el mercado
existen gran cantidad de sensores que permiten realizar estas funciones, como
los sensores de proximidad de fin de carrera, sensores de proximidad por medio
de ultrasonido, sensores de proximidad con luz infrarroja, sensores de proximidad
de video. A continuación se realizará un análisis de cada uno de los sensores,
enfocando más en los sensores de proximidad de luz infrarroja, sensores que son
los usados en este prototipo.
1.2.1 SENSORES DE PROXIMIDAD DE FIN DE CARRERA
Los sensores de proximidad de tipo fin de carrera son los más utilizados en los
mecanismos móviles, ya que poseen un modo sencillo de funcionamiento basado
en un interruptor, siendo así más versátiles al momento de ser instalados, pero el
inconveniente que presentan para el prototipo es que debe necesariamente tener
contacto físico con un obstáculo para reaccionar, lo que implicaría que el prototipo
debería chocar con los obstáculos para luego evadirlos. Además necesita de un
circuito eliminador de rebotes para que el receptor, tome la señal correcta en el
momento del accionamiento.
25
Vcc
SENALEMITIDA
CIRCUITO —ELIMINADOR DE
REBOTES
Figura1.9 Esquema deí funcionamiento y circuito de un sensor de fin de carrera
Como se puede observar en la figura 1.9 este sensor consta de dos contactos,
uno normalmente abierto y uno normalmente cerrado, ios cuales proporcionaran
la salida deseada* luego de ser activados.
1.2.2 SENSORES DE PROXIMIDAD POR MEDIO DE ULTRASONIDO
Este upo de sensores en la actualidad son los de mayor uso, pues permiten una
mejor guía a los robots autómatas. Así mismo estos sensores trabajan con el
principio de guía que tienen los murciélagos, entonces necesitan generar una
señal en alta frecuencia que es emitida al espacio y luego recibirla tomando en
cuenta el tiempo y ia intensidad de la señal de retorno; y de acuerdo a estos
datos se conocerá cual es la distancia a la que se encuentra un posible obstáculo.
La ventaja de este sobre el de final de carrera es que no necesita contacto físico
con el objeto para saber que el mismo esta cerca, además se puede tener una
noción de como es el entorno en el que el prototipo se encuentra.
26
SENSOR
EMISOR
FIGURA 1.10 Sensores de ultrasonido
RECEPTOR
La desventaja de este tipo de sensores dentro del diseño del prototipo
ímplementado tiene que ver básicamente con el tema de espacio físico, consumo
de energía, sobre dimensíonamiento y costo que implica tener uno de estos
sensores en el mismo, ya que primeramente el generar y recibir señales de alta
frecuencia obliga a utilizar amplificadores que aumentan la circuitería, ocupando
más espacio físico dentro del prototipo, además toda esta circuitería ocasionará
mayor consumo de energía. Por último el prototipo utilizará los sensores de
proximidad solo en un funcionamiento autónomo que no será el más utilizado,
pues todo el control se realiza en modo manual haciendo que estos sensores
sean usados momentáneamente y por ende todas sus virtudes desperdiciadas.
Sin tomar en cuenta también que su costo es más elevado que el de los sensores
implementados en el prototipo.
1.2.3 SENSORES DE PROXIMIDAD CON LUZ MFRAROJA
Este tipo de sensores basan su funcionamiento en la generación y recepción de
luz infrarroja utilizando un diodo emisor y un fototransistor que recibe dicha luz. Al
ser ubicados ambos dispositivos en un mismo punto podrán detectar objetos
próximos con el rebote que la luz hace sobre el posible obstáculo.
Antiguamente este tipo se sensores se veía afectado por la luz externa del
ambiente, mas con los adelantos de la tecnología este ya no es un problema ya
que se construyo un circuito integrado que es insensible al ambiente extemo
proporcionando mayor confianza y versatilidad en los sensores por infrarrojo.
27
Este circuito integrado es el ISF471 de la Sharp. [11] que además de proporcionar
esta ventaja posee internamente el oscilador que requiere el diodo emisor
reduciendo ef circuito del sensor a un potenciómetro de calibración de la distancia
de detección deseada. Por último cabe señalar que el consumo de energía es
mínimo y el voltaje de alimentación pequeño.
SENSOR
Figura! 11 Esquema y tamaño de un sensor de tipo infrarrojo
1.2.3.1 Descripción del funcionamiento del integrado ISF471
VccSV
ENCAPSUUADO
Figura 1.12 Diagrama de instalación del circuito, y encapsulado del mismo
El sensor basado en el dispositivo Sharp IS471F, tiene la facultad de ser inmune
a interferencias de luz del ambiente. Además este sensor incorpora un
modulador/demodulador integrado en su carcasa a través del cual se controla al
diodo emisor de infrarrojo externo, modulando la señal que este emitirá y que será
captada por el mismo. Cuando un objeto se sitúa frente del conjunto
emisor/receptor parte de la luz emitida es reflejada y demodulada para activar la
salida total que pasará a nivel bajo si la señal captada es suficientemente fuerte.
28
El uso de luz IR modulada tiene por objeto hacer al sensor relativamente inmune
a las interferencias causadas por la luz normal de una bombilla o la luz del sol.
Como puede verse en la figura 1.12, el sensor se alimenta por los pines 1 y 3 los
cuales corresponden a Vcc y Gnd respectivamente, el pin 2 es ia salida del
conjunto o salida de control y el pin 4 es la salida que modula al led emisor
externo.
Mediante el potenciómetro P1 se varia la distancia a ia que es detectado el objeto,
mientras más baja sea la resistencia de este potenciómetro, más intensa será la
luz emitida por el diodo de IR y por lo tanto mayor la distancia a la que puede
detectar el objeto,
1.2.4 SENSORES DE VIDEO
Este tipo de sensores son los más sofisticados en la actualidad y los de mayor
costo y mayor tamaño. Se basan en el tratamiento de imágenes mediante un
microcontrolador. Este microcontrolador trabaja de manera muy rápida
comparando las señales del instante con señales anteriores, es decir que utiliza
tecnología de inteligencia artificial. Por esta razón se deberá iniciaImente proceder
al adiestramiento del sistema, luego este podrá reconocer las imágenes.
El método desarrollado barre la imagen buscando aquellos píxeles con una
textura correspondiente a la de la imagen guardada, determinando cuales de ellos
constituyen una hipótesis aceptable de imagen.
29
Figura 1.13 Forma de digitalización en los sensores de video.
Entonces mediante filtros se logrará ir tomando las raíces del gráfico. Para así en
ei momento en ei que se produzca la comparación, realizarla con una que tenga
la misma forma, o los mismos píxeles. [12]
1.3 PROTOTIPOS YA IMPLEMENTADOS QUE UTILIZAN
SISTEMAS DE VIDEO
Dentro de la rebotica mundial existen prototipos ya implementados que utilizan
sistemas de video parecidos al desarrollado en este proyecto. A continuación se
citan algunos de ellos con su respectivo funcionamiento:
El RMTO I (Robot Móvil Teleoperado) fue ei resultado del proyecto de grado en
Ingeniería de sistemas desarrollado por Alexander Cerón en la Universidad
Nacional de Colombia Sede Bogotá, está equipado con una cámara de video y es
operado a distancia por medio de un enlace inalámbrico de radiofrecuencia. La
operación del vehículo se realiza a través de un programa de computador dotado
de una interfaz gráfica de usuario que permite enviar comandos de movimiento al
i i>_< w M i iicíi it«_* ticr ica- u¿ai t iai a j - ^ - ui l
radio frecuencia para la transmisión al computador. El tipo de enlace es el sistema
de desarrollo GP_Bot dispone de un conector para un módulo de radio Aurel y en
el CRMcon los radio-modem disponibles en el mercado
Figura 1.15 Observer (Foto tomada de la referencia [13])
El proyecto más relevante en este tiempo es el prototipo enviado a Marte llamado
ROVER SPiRIT. Este sistema cuenta con 3 cámaras ubicadas estratégicamente,
las cuales envían las señales de video hacia la tierra, para ser estudiados. Este
sistema fue construido por científicos de la NASA, los mismos que crearon dos
prototipos similares, para la exploración espacial, el Spirií y el Oportunity[14].
M» VÍT* ff.
Figura 1.16 Spirit (Foto tomada de la pagina web de la nasa)
32
Estos son algunos de los prototipos construidos para la exploración, como el
presentado en este proyecto de titulación.
33
CAPITULO 2
2 DISEÑO DESABOLLO E 1MPLEMENTACION BEL
HARDWARE
2.1 FUNCIONAMIENTO GENERAL
Dentro de este capítulo se explicará todo acerca de los diseños realizados y las
partes implementadas en el prototipo hasta conseguir su ensamblaje tota!.
Primeramente hay que señalar todas las funciones que deber cumplir el
prototipo por medio de órdenes de voz dadas por el usuario
• El prototipo tiene 2 modos de funcionamiento que son manual y
automático, estos modos son seleccionados por el usuario medíante
comandos de voz
• En el modo automático el robot explorará el medio de manera autónoma
evadiendo objetos en su recorrido para lo cual se deberá utilizar
sensores de proximidad e ímplementarlos dentro de los puntos más
representativos de su estructura, estos indicarán la presencia de
obstáculos al microcontrolador el cual tomará la decisión de movimiento
para evadirlos. Además deberá realizar la transmisión de audio y video
del medio donde se encuentre, para lo cual se colocará una cámara con
un transmisor de audio y video inalámbrico, el mismo que transmitirá la
señal constantemente a un receptor, que podrá ser un televisor
cualquiera.
• En modo manual el prototipo debe esperar las ordenes del usuario
dando la posibilidad de avanzar: adelante: atrás; derecha; izquierda;
para lo cual se debe diseñar los controladores para los motores de que
permiten e! movimiento del mismo. Además durante este modo la
cámara tiene la capacidad de moverse -en los dos grados de libertad,
permitiendo así una panorámica del ambiente en el que se encuentra
34
explorando el prototipo. Este movimiento se lo realiza medíante dos
servomotores que gobiernan los 2 grados de libertad de la cámara.
En este modo se podrá sujetar objetos con una pinza, la cual posee 1
grado de libertad y el movimiento que permite abrir y cerrar la misma. Al
igual que la cámara estos movimientos son controlados por medio de
. dos servomotores que están acoplados a la pinza
De igual manera en este modo el prototipo deberá transmitir audío y
video continuamente.
2.2 íffiQÜEIUMDENTOS MECÁNICOS
El prototipo desarrollado en e! presente proyecto posee elementos mecánicos y
electromecánicos que le permiten realizar todos los movimientos, tanto de
locomoción en cuatro direcciones, como los movimientos de la cámara en
cuatro direcciones y de la pinza en 2 direcciones.
2.2.1 EVJPLEMENTACION DE VEHÍCULO MOTORIZADO TJÍO ORUGA
El robot explorador utiliza como chasis de su estructura el caparazón de un
vehículo tipo oruga con tracción diferencial, es decir un motor DC con juego de
piñones (motor-reductor) para cada oruga. Este chasis se constituye en el
soporte del robot, en donde es ensamblarán todos los elementos constitutivos
del prototipo.
35
Figura 2.1 Chasis del Robot; relación de tamaño con un marcador común
Figura 2.2 Chasis dei robot vista frontal
Figura 2.3 Chasis del robot vista posterior
36 12.2.2 CÁMARA MÓVIL
Este prototipo utiliza una cámara infrarroja para visión nocturna del tipo SXKSX
300 ensamblada en una estructura constituida por dos servomotores que
permiten a la misma realizar un giro posicionado de arriba hacia abajo y de
vista delantera y posterior respecto del vehículo en un ángulo máximo de 180
grados. A continuación se indican características técnicas de la cámara.
Tabla 2.1 Características Técnicas de la Cámara
MODELO
ALIMENTACIÓN
CORRIENTE
MAX
ENFOQUE
SXKSX 300 VISION NOCTURNA
6 LEDS INFRARROJOS
12VDC
25mA
MANUAL
Figura 2.4 Cámara Infrarroja; relación tamaño con un marcador común
37
2.2.3 IMPLEMENTACION PINZA PARA SUJETAR OBJETOS
La pinza implementada para sujetar objetos esta constituida por un juego de
dos servomotores ensamblados en una estructura móvil en forma de pinza que
permite sujetar un pequeño objeto de un diámetro máximo de 32mm, Posee
dos movimientos, uno que le permite abrir o cerrar la pinza. Y otro permite girar
(a pinza para sujetar objetos dispuestos paralelamente a la abertura de ia
misma.
Figura 2.5 Pinza para sujetar objetos; relación tamaño con un marcador común
Figura 2,6 Pinza para sujetar objetos (2 movimientos) vista frontal
38
2.3 IffiQlJEJRlMlENTOS ELÉCTRICOS Y ELECTRÓNICOS
Todos los elementos electromecánicos y electrónicos que permiten el
funcionamiento conjunto del prototipo están gobernados por un
microcontroiador PIC que será el encargado de administrar el funcionamiento
de los actuadores obedeciendo las órdenes recibidas a través del kít de
reconocimiento de voz que a su vez será la interfaz entre el usuario y el robot.
f APAGADO PARAALIMENTACIÓN OEI LOS SENSORES .
MICRO
R RA ¿ B
,.16F
r
ONTROL
iDOR
ru
i ,i
ii
v 1
1]11
fI
"7T~V _
74LS373
MtCRGPRGCESADORDE
RECONOCIMIENTODE VOZ
VOtCEDIRECTH
E N T R A D A
74LS24
SENSORESEXTERNOS
SENSOREStNFRARQJOSY DE FINALDE CARRERA
74LS373
MOTORESSERVO
MOTORES
S A L Í D A
.Figura 2.7 Esquema del Hardware del Robot Explorador tipo Oruga
2.3.1 DISEÑO DE TARJETA DE CONTROL MADRE
La tarjeta madre es la que realiza el control del robot y permite tomar las
decisiones de movimiento de acuerdo con la lógica de programación del
elemento "inteligente" que para este caso es el controlador PIC 16F876.
2.3.1.1 PIC 16F876
A continuación se describe ei nombre y la función de cada uno de los pines
que conforman el microcontrofador Pie 16F876
Tabla 2.2 Recursos Utilizados
(NOMBRE DEL PIN) Na DEL PIN |TIPO
ODC1/CLKIN
OSC2/CLKOUT
MCLR/Vpp
9
10
1
I
O
I/P
TIPO DEAMPLIFICACIÓN
ST/CMOS
ST
DESCRIPCIÓN
Entrada del cristaloscilador/entrada externa de lafuente del reloj
salida del cristal oscilador
reset del chip cuando esta enbajo/voltaje de entrada deprogramación
PUERTO A B1D1RECCIONAL I/O
RAO/ANO
RA1/AN1
RA2/AN2/VREF-
RA3/AN3A/REF+
RA4/TOCK1
RA5/SS/AN4
2
3
4
5
6
7
I/O
I/O
I/O
I/O
I/O
I/O
TTL
TTL
TTL
TTL
ST
TTL
Activación de sensoresinfrarrojos
Activación de recepción depalabra del kit de reconocimiento
de voz
Activación de servomotores
Sensor de final de carrera de lapinza
Aviso de envió de palabra del kitde reconocimiento de voz
Encendido/ Apagado
PUERTO B BIDIRECCIONAL I/O
40
RBO/INT
RB1
RB2
RB3/PGM
RB4
RB5
RB6/PGC
RB7/PGD
21
22
23
24
25
26
27
28
I/O
I/O
I/O
I/O
I/O
I/O
!/O
I/O
TTL/ST
TIL
TTL
TTL
TTL
TTL
TTL/ST
TTL/ST
Pin 1 Voice Direct/Aviso deObstáculo al Frente
Pin 2 Voice Direct/Aviso deObstáculo o hueco a la derecha
Pin 3 Voice Direct/Aviso deObstáculo o hueco a la izquierda
Pin 4 Voice Direct
Pin 5 Voice Direcí
Pin 6 Voice Direct
Pin 7 Voice Direct
Pin 8 Voíce Direct
PUERTO C BIDIRECCIONAL I/O
RCO/T1OSO/T1CK1
RCimOSi/CCP2
RC2/CCP1
RC3/SCK/SCL
RC4/SCK/SCÍ/SDA
RC5/SDO
RC6/TX/CK
RC7/RX/DT
VSS
VDD
11
12
13
14
15
16
17
18
8,19
20
I/O
I/O
I/O
l/O
I/O
l/O
l/O
l/O
P
P
ST
ST
ST
ST
ST
ST
ST
ST
Activa motor DC Izquierdo
Activa motor DC Derecho
Activa reversa en motor CDIzquierdo
Activa reversa en motor CDDerecho
Servomotor de Pinza(Abrir Cerrar)
Servomotor de Pinza(Horizontal Vertical)
Servomotor de Cámara(Arriba Medio Abajo)
Servomotor de Cámara(Frente Posterior)
Referencia o Tierra
Voltaje de polarización
41
I: EntradasO: SalidasI/O: Entrada/SalidaTTL: Entrada TTLP: AlimentaciónST: Entrada Schmitt Trigger
MCLR/VPP-RAO/ANO-RA1/AN1
RA2/AN2/VREF--RA3/AN3A/REF-*-"
RA4/TQCKI-RA5/AN4/SS'
VSS-OSC1/CLKIN-
OSC2/CLKOUT-RcomosorriCKi-
RC1/T1OSI/CCP2*
RC2/CCP1-RC3/SCK/SCL-
cccccccccccccc
"12
34
5
6789
101112
1314
w
co
oo
££oo1 1LL_
oQ.
28|2726
25|24Í23Í22Í21 120|19]
17|16|
1S|
RB7/PGDRB6/PGCRB5RB4RB3/PGMRB2RB1RBO/INTVDDVssRC7/RX/DTRC6/TX/CK
RC5ÍSDO
RC4/SDI/SDA
Figura 2.8 Mícrocontrolador pie 16F876
Además se han colocado BUFFERs y LATCHs que se tomarán como entradas
y salidas del mícrocontrolador; en las entradas para ampliar su número, y en
las salidas para proteger los pines del mícrocontrolador Pie de posibles sobre
corrientes por cortocircuitos. Teniéndose así el diagrama esquemático
mostrado en la figura 2.9
m
Fig
ura
2.9
Dia
gram
a E
squem
átic
o d
e la
Tar
jeta
Mad
re
E! diagrama esquemático muestra varios conectores designados como: RCO;
RC1; RC2; RC3; RC4; RC5; RC6; RC7; RC8.
Los mismos que realizan las siguientes funciones:
• RCO conector de alimentación de la tarjeta madre.
• RC1 conector externo del pórtico A de! PIC. Aquí se conectan señales
de entrada ya descritas en ía tabla 2.2; el pin 1 de! conector es e! pin 3
del puerto A (RA3).
• RC2 bus de entrada de la palabra reconocida por el kit de
reconocimiento de voz.
• RC3 bus de control de motores DC y servomotores del robot.
• RC4, RC5, RC6 bus de entrada para sensores infrarrojos (Frente,
Abismo, Derecha e Izquierda).
• RC7 entrada auxiliar al prototipo (No utilizada).
• RC8 salida de activación de sensores infrarrojos.
2.3.2 EVCPLEMENTACION DEL CONTROL POR VOZ
Como ínterfaz entre el usuario y el microcontrolador se ha implementado en el
prototipo el control por voz, utilizando el "VOICE DIRECT II" que recibirá las
ordenes del usuario en forma de palabras y como resultado de! reconocimiento
envía los datos a través de un bus al microcontrolador que toma las decisiones
correspondientes.
El kit cuenta con una entrada de audio para ingresar las palabras, así como de
una salida de audio que repetirá las palabras reconocidas y también dará
mensajes audibles hacia el usuario. Además posee una memoria de programa
y una memoria de datos, la primera para su programación, y la segunda para
almacenar las palabras entrenadas para el reconocimiento.
E! bus de salida de datos hacia el microcontrolador es de 8 bits y la capacidad
de reconocimiento del kit es de quince palabras. El tiempo de activación de las
salidas una vez reconocida una palabra es de un segundo por lo que se usa un
LATCH para mantener esta señal por más tiempo.
44
Figura 2.10 Kit de Reconocimiento de Voz
1 í 1
. í•^ -c-
í¿f> fx - . , •.-.! . - .X'Aí^l&yvrt.'^•fe^'-i'-x^éww^-^i j £& - í'.lffiS^o^l^;- ^Bf pS'31
Figura 2.11 Microprocesador de reconocimiento de voz
45
2.3.3 DISEÑO DE SENSORES INFRARROJOS DE PROXIMIDAD
Tal como se indico en el capítulo anterior el vehículo podrá realizar una
exploración autónoma del entorno donde se encuentra para lo cual debe evadir
los obstáculos próximos dentro de su trayectoria por lo que se diseñaron
sensores infrarrojos de proximidad que están ubicados en lugares estratégicos
para evitar que el robot se choque contra algo o lo que es peor caiga dentro de
algún abismo de donde no pueda salir.
Estos sensores utilizan como principio de funcionamiento el de emitir una señal
infrarroja hacia el frente esperando que ésta rebote en algún cuerpo y sea
percibida por el receptor dando entonces una señal de presencia de objeto.
Para el diseño se ha utilizado un circuito integrado SHARP IS471F que posee
en su encapsulado todo el circuito receptor, necesitando para su
funcionamiento solamente un diodo emisor y para la calibración de la distancia
un potenciómetro que aumenta o disminuye la corriente en dicho diodo,
haciéndolo más o menos sensible al sensor.
Las características del dispositivo Sharp IS471F se describen a continuación:
Tabla 2.3 Características Técnicas del Chip IS471F
MODELO
ALIMENTACIÓN
(VCC)
TEMPERATURA DE
FUNCIONAMIENTO
VOLTAJE DE
SALIDA
CORRIENTE DE
SALIDA
POTENCIA DE
DISIPACIÓN
SHARP IS471F
DE 4.5 [V]
DE -25°C
a!6[V]
a60°C
Vcc
50[mA]
250[mW]
46
El diagrama del circuito es:
VccSV
SalhU
GtHD DEL
Figura 2.12 Circuito Acondicionador del sensor SHARP IS471F
Para la calibración se uso un potenciómetro de 100 ohmios que se lo varía
desde 20 ohmios hasta un máximo de 60 ohmios. Así:
corriente, en d diodo :
Vcc 5\V\ = - = • — L J ^ = 50/77^4
1 R 100[n]
VccId~~
2— ~ :
R 280[Q]
Mayor Distancia (10 ciri)
Menor Dis~ten.cia (3 cm)
2.3.4 IMPLEMENTACION DEL CBRCÜITO CONTROLADOR DE LOS
MOTORES DC
Para controlar al accionamiento de los motores de se utiliza un circuito
propuesto en anteriores proyectos puesto que ha presentado excelentes
resultados, permitiendo controlar su accionamiento y cambio de giro sin afectar
al funcionamiento normal del microcontrolador pie.
47
A continuación se presenta el circuito con todos los elementos ya calculados en
los anteriores proyectos [14] para motores similares al utilizado en el prototipo:
Vcc
señal de control 1
señal de control S-^ww-
4
1
k-.1 X 1
*UI J
1t'-l
í T„ ... i . ^i
-..
i
•il
»°j
_™t
2
\"^,
X_' 3 J
.,,._
c
1 1 'Wvv
O,,
>
-j
i — i
^
2
i
Figura 2.13 Esquemático Circuito controlador motores DC
La señal de control 1 permite invertir la polaridad de la entrada de alimentación
hacia el motor DC, mientras que la señal de control 2 alimenta directamente al
motor DC.
2.3.5 IMPLEMENTACION DEL TRANSMISOR DE AUDIO Y VIDEO
PARA LA CÁMARA
Este prototipo utiliza un Transmisor de audio y video NIPÓN WV-300 para
enviar la señal desde el prototipo hacia el receptor que será cualquier receptor
de televisión, para la calibración de la frecuencia de la transmisión se debe
sintonizar al televisor en un canal cualquiera desde el 14 al 31 (en UHF) e ir
modulando el control de ajuste de canal del transmisor hasta obtener la mejor
señal en el receptor
Las características del transmisor se describen a continuación:
48
Tabla 2.4 Características Técnicas del Transmisor de Audio y Video
MODELO NIPÓN WV-300
ALIMENTACIÓN 12VDC
CORRÉENTE MAX lOOmA
ALCANCE MAX500 PIES / 152m (en línea de
vista)
CARACTERÍSTICAS
ADICIONALES
Control de volumen, brillo, yfrecuencia de transmisiónajustables
Figura 2.14 Transmisor Audio-Video; relación tamaño con un marcador común
49
2.3.6 IMPLEMENTACION DEL TRANSMISOR DE AUDIO
Para la transmisión de las instrucciones de audio desde eí lugar donde se
encuentra el usuario hasta el prototipo se ha implementado un transmisor de
radio en la banda FM constituido por un micrófono-transmisor y un receptor-
FM que esta ubicado en el robot y que se conecta a la entrada de audio del kit
de reconocimiento de voz para hacer funcionar al prototipo.
Tabla 2.5 Características Técnicas del Transmisor de Audio
MODELO
ALIMENTACIÓN1.5VDC
CORRIENTE MAXlOmA
ALCANCE MAX15m (en línea de vista)
CARACTERÍSTICAS
ADICIONALES
Control de frecuencia, Funciónalámbrica e inalámbrica
Figura 2.15 Micrófono trasmísor de audio
50
Figura 2.16 Transmisor Audio; relación tamaño con un marcador común
2.3.7 DISEÑO DE CIRCUITO CONTROLADOR DE SERVOMOTORES
Para el control de ios servomotores que gobiernan el movimiento de la cámara
en 2 ejes y de la pinza también en 2 ejes se utiliza solamente un transistor
hacia el motor que será disparado directamente por eí píe el tiempo que sea
necesario para poder llegar a la posición esperada
Los servomotores utilizados tanto en la pinza como en la cámara son
HOBBICO y sus características técnicas así como las señales que lo controlan
son:
Tabla 2.6 Características Técnicas de Servomotor
MODELO
ALIMENTACIÓN
(VCC)
TORQUE MÁXIMO
VOLTAJE DE
CONTROL
CORRIENTE MAX
HOBBICO M25
DE 4.5|Y] a 6[V]
3.56 kg.cm
DE 4.5[V] a 6[V]
50[mA]
1.50 rns:Neutni!o J*
o y90° GRADOS
J,.25ms:-0desreesp p H H
O N W N)O vi u ví
3 S c^ S 0° GRADOS
1.75 ms: ISO degrees
0 t«1 I
180° GRADOS
Figura 2.17 Esquema de pulsos para el servomotor
Figura 2.18 Servomotores Vista Frontal Y Lateral
52
2.3.8 IMPLEMENTACION DEL TRASMISOR DE DATOS
Para enviar las instrucciones de ENCENDIDO/APAGADO, RESET, INGRESO
DE PALABRA, BORRAR MEMORIA, Y RECONOCER PALABRA desde el
usuario al robot se utilizó un trasmisor receptor de radio frecuencia que permite
enviar cinco señales de control. Este transmisor no fue implementado en el
proyecto sino se lo uso como un elemento funcional predeterminado.
Figura 2.19 Control remoto del robot explorador
2.3.9 RECARGA DE BATERÍAS
Dentro del diseño del prototipo se utilizaron treinta baterías recargables de 1.2
voltios (1.5 a máxima carga) las cuales se agruparon de la siguiente manera:
• Cuatro baterías recargables en serie (5.2 voltios aprox.) que alimentan la
tarjeta madre de control, el kit de reconocimiento de voz, el receptor de
datos, y el receptor de audío.
* Cuatro baterías recargables en serie (5.2 voltios aprox.) que alimentan el
motor DC1 encargado de la locomoción del prototipo en el flanco
derecho.
. - 11 1I1
1
A_ _ .
r~i
i
i " — i — ' ji
GNO /O V+(Sy)
Ptjg do cargade
Figura 2.20 Diagrama en bloques de! circuito de conexión de baterías.
54
2.3.9.1 Procedimiento para recargar las baterías
• Para recargar las baterías de 12 voltios, que alimenta tanto a la cámara,
como ai transmisor; se debe colocar el interruptor numero O en posición
apagado, entonces se puede alimentar al robot con una fuente de 12
voltios por la entrada prevista para ello.
A \^ffip—•**.
(a)
Figura 2.21 (a) Interruptor #0 (b) Entrada de 12 voltios
(b)
Para recargar las baterías de 5 voltios, el robot debe estar apagado
previamente y dependiendo de la posición de los interruptores laterales
se aumentará uno u otro sector del mismo. En la tabla 2.7 se puede ver
la posición de los interruptores (ON, OFF) para cargar las baterías que
se encuentran en el vehicuio explorador
Tabla 2.7 Posición de interruptores
SECTOR
MOTORES
DC
SENSORES
Y SERVOS
TARJETAS
CONTROL
INTERRUPTOR
OFF
ON
ON
INTERRUPTOR
OFF
ON
ON
INTERRUPTOR
ON
OFF
ON
55
a) (b)
Figura 2.22 (a) Interruptores #2 Y #3 (b) Entrada de 5 voltios
2.3.10 ENSAMBLAJE DEL ROBOT EXPLORADOR TIPO ORUGA
El ensamblaje del prototipo se io realizó conforme se indica a continuación
teniendo en cuenta que cada elemento que se adicionaba al robot debía ser
probado previamente y en conjunto con ios anteriores para verificar su
funcionamiento, de igual manera debían ser consideradas sus dimensiones y
eí rediseño de ser necesario por el tamaño compacto que tiene el prototipo en
conjunto, utilizando todo su espacio interior y exterior para este objetivo.
2.3.10.1 Estructura original o chasis del robot
El chasis del robot es el carapacho de un vehículo motorizado tipo oruga que
contiene en su interior dos motores DC acopiados a un conjunto de piñones o
engranajes solidarios cuya única función es transformar la velocidad del motor
en torque capaz de mover toda la estructura, convirtiéndolos en motor-
reductores
56
Caja MotorReductor
Figura 2.23 Ubicación de los motores DC dentro del chasis de! prototipo
2.3.10.2 PCI Circuito controlador de los motores DC
Este circuito posee 4 entradas y 4 salidas en pares que sirven para controlar el
accionamiento y cambio de sentido de giro de cada uno de los 2 motores DC
que permiten la locomoción del vehículo. E! cambio de sentido se realiza por
medio de un transistor que dispara un relé que polariza inversamente las
entradas al motor:
Las dimensiones de esta plaqueta son:
Ancho: 4cm
Largo: 6.5cm
Figura 2.24 Tarjeta de control para motores DC
57
REV
Figura 2.25 Diagrama esquemático de la tarjeta de control para motores DC
2.3.10.3 PC2 Tarjeta de control madre
Esta tarjeta contiene al microcontrolador PIC encargado de realizar el control
sobre todos los movimientos del robot, así mismo posee buífers conectados al
PIC que permiten la ampliación de puertos del mismo para mayor número de
entradas y salidas, posee 16 entradas y 14 salidas
Sus dimensiones son:
Largo: 9.5cm
Ancho: 6.8cm
Figura 2.26 Tarjeta madre de control
58
2.3.10.4 PC3 Tarjeta madre del kit de reconocimiento de voz
Dentro de esta tarjeta se encuentra el micro RSC300 que permite realizar el
reconocimiento de las palabras posee una entrada de audio, salida de audio
(speakers), 8 pines de control.
Sus dimensiones son:
Largo: 14.1cm
Ancho: 8.3cm
B*~«J i, 'i [ T^S-ltEtS^jOé3i ¡*-~?-r i' '•'-C' gF-i-ft! Lí-u ií - - «J.,
Figura 2.27 Tarjeta de reconocimiento de voz
1 J
T0
1->
ca
o =t=
cz?
3
1 1U
D,f
Fig
ura
2.28
P
C2
Dia
gram
a es
quem
átic
o de
l kit
de v
oz
part
ea)
VDEÍ
Ví»
PV-rt
—
py-fi
¡••v
-J'í'irt
'•'•?.
X
í:>f
r™
< .? • •;1 í;í •%<>
i
S1 í* •*»
H »:..
>•»
,,;;
»;../
>•.-;
, iv;
v«"
.ffif
c""?
- í7í
T •«•
—"•%
"1
r.¿W
UX
A-y
\:
J I
^
y^a«
y-
¿íi i* {¿
f-i *3*i3
> lltí
ft* y
í!»,r |
.^
!s..
!
íftl
ií^
4V.Í »
Fig
ura 2
.29
PC
2 D
iagr
ama
esqu
emát
ico
del k
it de
voz
pa
rte b
)
61
2.3.10.5 PC4-PC11 Circuito Sensor Infrarrojo de proximidad
Dentro de esta tarjeta se encuentra el circuito emisor-receptor infrarrojo que
permite detectar objetos sobre la trayectoria del robot, posee una salida digital
que ingresa al PIC para que este realice el control sobre los movimientos del
prototipo y evite que el mismo choque o caiga.
Sus dimensiones son:
Largo: 2.2cm
Ancho: 1.8cm
r ,Ví7^--v;* s • Hi -.o • :•»>; '-* ""'
> '.
Figura 2,30 Tarjeta de sensor Infrarrojo vista lateral
Figura 2,31 Tarjeta de sensor Infrarrojo vista frontal
62
2.3.10.6 PC12 Tarjeta alimentadora de ios Sensores y Servomotores
Esta tarjeta tiene como función activar o desactivar la alimentación de los
sensores infrarrojos, esto para que solo funcionen en el modo automático de
exploración evitándose así un gasto innecesario de energía cuando el prototipo
se encuentra explorando en forma manual, donde estrictamente realiza los
movimientos requeridos por el usuario. Posee como entrada una señal de
control del PIC que indica sí se quiere o no alimentar a los sensores y una
única salida que controla el suministro de energía hacia los mismos.
Sus dimensiones son:
Largo; 3.4cm
Ancho: 2.5cm
+5 Vcc
SENSORES
SENSORES 1
PIN RAO
PINRAfl
SERVOMOTORES
Figura 2.32 Diagrama esquemático para control de sensores
63
2.3.10.7 PC13 Tarjeta transmisor de Audio y Video
Esta tarjeta contiene e! transmisor de Audio-Video para la cámara que envía
señales al receptor que será cualquier televisor
Sus dimensiones son:
Largo: 14cm
Ancho: 9cm
Figura 2.33 PC13 Tarjeta Transmisor Audio-Video
2.3.10.8 PC14 Circuito Receptor de Audio
Dentro de esta tarjeta se encuentra ei receptor de audio que recibe todas las
órdenes del usuario y las ingresa a la entrada del kit de reconocimiento de voz
que las decodificara transformándolas en señales digitales para que sean
leídas por e! microcontrolador.
Sus dimensiones son:
Largo: 6.5cm
Ancho: 2.7cm
64
Figura 2.34 PC14 Tarjeta Receptor de Audio
23.10.9 PC16 Circuito Transmisor de Audio y de Datos(externo)
Dentro de esta tarjeta está el transmisor de audio en FM que envía las señales
de la voz de! usuario hasta el receptor remoto colocado en e! prototipo, además
también se tiene la tarjeta de transmisión de datos que envía señales de
encendido / apagado así como de ingreso, borrado, reseteo y reconocimiento
de palabra al robot.
Sus dimensiones son:
Trasmisor de Audio:
Largo: 5cm
Ancho: 2cm
65
Figura 2.35 PC16 Tarjeta Transmisor Audio (Externa)
Trasmisor de Datos:
Largo: 6.5cm
Ancho: 4.8cm
Figura 2.36 PC16 Tarjeta Transmisor Audio (Externa)
2.3.10.10 Ubicación de las tarjetas dentro del chasis
En la Figura 2.37 se presenta !a distribución de las tarjetas de hardware sobre
e! vehículo.
66
TARJETADE
RECONOCIMIEDE VOZ
O
//Qrugasvx
~J" 'li, Tb"*"<<l*l!lí :'" ^*jl
TARJETAMADRE
TARJETADE
CONTROLDE
MOTORES
QCI=ZJl'rij)lNSMISOR DE AUDIO Y~\\O
Figura 2.37 Distribución de tarjetas en el vehículo
2.3.11 PROCEDIMIENTO PARA MANEJAR AL ROBOT EXPLORADOR
TIPO ORUGA
Para poner en funcionamiento al prototipo se requiere seguir la secuencia de
acciones detallada a continuación:
67
2.3.11.1 Encendido del robot
El robot explorador tipo oruga cuenta con dos interruptores principales de
alimentación, el primero alimenta a toda la parte motriz del mismo y se
encuentra ubicado en su parte inferior izquierda como se muestra en la Figura
2.38
Figura 2.38 Ubicación del interruptor principal #1
El segundo interruptor es el encargado de alimentar al transmisor de audio y
vídeo que enlaza las imágenes de la posición de robot con el receptor del
usuario. Este se encuentra en la parte frontal como se muestra en la Figura
2.39
Figura 2.39 Ubicación del interruptor #0 de encendido del transmisor
68
En el momento en que este interruptor es accionado se encenderá una luz
piloto que indica que el transmisor empezó a enviar la señal generada por la
cámara, sin necesidad que la parte motriz del robot este activada aún. El
receptor (televisor) debe estar inicialmente sintonizado en el canal 19, más esto
no es una exigencia pues puede ser calibrado para otro canal de la banda de
UHF mediante el potenciómetro que posee el transmisor, el cual se muestra en
la Figura 2.40
Figura 2.40 Ubicación del potenciómetro para calibración de la frecuencia del transmisor
Una vez obtenida una recepción apropiada de la señal en el televisor, se
puede energizar la parte motriz del robot, momento en el cual se enciende
también el kit de reconocimiento y envía un zumbido hacía el transmisor de
audio y video que puede ser oído en el televisor. En este momento el robot esta
listo para iniciar su funcionamiento.
Como ultima acción para dejar al robot en espera de una orden se usa el
control remoto, pulsando el botón de encendido / apagado, con lo cual el
prototipo despierta, acomoda la cámara y la pinza dejándolas en la posición
inicial y espera que el usuario envié las instrucciones.
69
Figura 2,41 Control remoto de! explorador
Botón 1 graba comandos de voz como instrucciones
Botón 2 ingreso de orden a! robot
Botón 3 encendido / apagado de la parte móvil del robot
Botón 4 resetea a la tarjeta de reconocimiento de voz
Botón 5 borra todas los comandos de voz (15 palabras) almacenadas en
la memoria del robot
Figura 2.42 Micrófono para enviar ios comandos de voz al robot
11 interruptor de encendido del micrófono.
70
2.3.11.2 Manejo del robot
Para poder comandar todos los movimientos que efectúa el robot se deben
primero conocer las ordenes de voz que los gobiernan, una vez encontrado el
comando requerido se presiona el botón dos del control remoto, momento en el
cual se escucha una voz en el televisor que índica que se puede ingresar la
palabra u orden de acción; sí la palabra es ingresada y reconocida como
acertada el robot ejecuta el comando relacionado a la misma caso contrario
envía un mensaje de fallo en eí reconocimiento.
Tabla 2.8 Comandos de voz
N° i Descripción de la Orden123456789101112131415
Modo automáticoMovimiento por pasosCámara vista abajoCámara vista arribaCámara vista al medioMovimiento hacia delanteMovimiento hacia atrásGiro a la izquierdaGiro a ia derechaAbre pinzaCierra la pinzaPinza en posición horizontalPinza en posición verticalCámara con vista al frenteCámara con vista atrás
PALABRAAutoPasosAbajoArribaMedio
AdelanteAtrás
IzquierdaDerecha
AbrirCerrar
HorizontalVerticalFrente
Posterior
Para conocer si el robot ha reconocido acertadamente la palabra y no hubo un
reconocimiento falso, se puede comparar la respuesta del robot e! momento
que ha reconocido acertadamente una orden, esta respuesta es un número
entre el 1 y 15, el cual se puede comparar con el número de la instrucción o
comando de voz.
Ei usuario puede controlar tres objetos en el robot; la cámara, la pinza, y el
movimiento en si. La cámara tiene cinco movimientos; Arriba, Medio, Abajo,
Frente, Posterior, la posición original es al frente en posición rnodls.
71
La pinza puede realizar los siguientes movimientos: abrir, cerrar, este último
será hasta sentir presencia del objeto a sujetar, colocarse de forma horizontal y
colocarse de forma vertical. La posición original es horizontal y abierta.
Por último el robot puede moverse de dos maneras de forma continua y a
pasos, dentro de estas opciones podrá avanzar, regresar, girar hacia la
derecha y girar hacia la izquierda. Adicionaimente puede realizar movimientos
de manera autónoma donde evade los obstáculos dentro de su trayectoria.
Para poder detener al robot en cualquier momento basta solo con presionar el
botón dos o de ingreso de palabra y no dar orden alguna o en su defecto
apagar los movimientos del mismo con el botón encendido / apagado.
2.3.11.3 Apagado del vehículo
Para el apagado temporal de robot, solo basta pulsar el botón de encendido /
apagado, de esta forma el prototipo se mantendrá en modo de consumo
mínimo, pero siempre trasmitiendo vídeo y audio hacia el usuario, pendiente
de cualquier comando de voz.
En caso de querer apagar completamente al robot, se debe colocar
manualmente e! interruptor uno en la posición OFF, entonces el prototipo deja
de recibir órdenes, para luego por último desconectar el trasmisor mediante el
interruptor cero, terminando así su funcionamiento.
En el siguiente capítulo se habla a cerca del software desarrollado para
controlar el funcionamiento del robot explorador tipo oruga.
72
CAPITULO 3
3 DESARROLLO DEL SOFTWARE
3.1 GENERALIDADES
Dentro de este capítulo se explica todo acerca de la configuración y estructura
del software realizado para conseguir el funcionamiento del prototipo. Como ya
se detalló en el capítulo anterior el robot debe realizar varias actividades dentro
de su funcionamiento, las cuales estarán gobernadas por un mícrocontrolador
PIC que sigue una lógica de programación que esta estructurada de acuerdo
con los requerimientos que debe satisfacer el mismo.
Dicho software esta capacitado para controlar el accionamiento de los motores
que permiten la locomoción del robot, el ángulo de operación de los
servomotores que mueven tanto la cámara como la pinza, detectar la presencia
de obstáculos dentro de la trayectoria y evadirlos, y controlar el accionamiento
del kit de voz. La respuesta rápida del PIC hace que el control del sistema sea
inmediato y eficaz.
El software desarrollado para el sistema de exploración se constituye en una
serie de secuencias lógicas que permiten el manejo del robot haciendo que
cada una de sus funciones sean confiables; detectando instrucciones falsas o
vacías y protegiéndolo mecíante la inmovilización hasta que se ingresen
instrucciones acertadas, evitando cfioques e incluso caídas que puedan
destruir la estructura del mismo.
3.2 PROGRAMACIÓN DEL MICROCONTROJLADOR
PIC16F876
El Microcontrolador PIC16F876, es el elemento que realiza el control total del
robot, el mismo posee 28 pines de los cuales 24 son útiles como periféricos de
entrada y/o salida, siendo estos suficientes para realizar todas las actividades
que conforman el funcionamiento del prototipo, de igual manera la memoria de
programación que brinda este PIC (4k) rebasa ampliamente el conjunto de
instrucciones que constituyen el software del sistema, dando la posibilidad de
ampliar su estructura en un futuro si se lo requiriere.
Dentro de las actividades que desarrolla el microcontrolador se tiene las
siguientes:
> Manejo de Periféricos
• Entradas:
• Encendido / Apagado
• Kit de reconocimiento de voz
• Sensores Infrarrojos de detección de obstáculos
• Sensor de final de carrera para cerrado de pinza
• Salidas:
• Activación de Motores (on / off)
• Activación de los,Servomotores(PWM)
• Activación de los Sensores Infrarrojos (on / off)
• Activación del control de voz (on / off)
• Luces de Señalización
> Identificación de las palabras u ordenes
> Detección y Evasión de obstáculos sobre trayectoria de prototipo
> Manejo de Servomotores (Pinza y Cámara)
> Manejo de Motores DC (Locomoción del robot)
74
3.2.1 DESARROLLO DEL FLUJOGRAMA GENERAL DE
PROGRAMACIÓN
El diseño del software basa su funcionamiento en un programa constituido de
las siguientes partes principales:
> Inicio
> Lazo Principal
> Identificación de Palabras u Ordenes
> Subrutinas de Acción
3.2.1.1 Inicio
Durante esta parte del programa se realiza !a configuración de los puertos del
microcontrolador como entradas o salidas respectivamente, así mismo se
inicializan fas variables que intervienen en el programa y por último se
estructura una pequeña subruttna que tiene como objetivo dejar al prototipo en
condiciones iniciales para su funcionamiento, esto quiere decir posicionamiento
inicial de la cámara hacía el frente y de la pinza en posición vertical.
75
CONFIGURACIÓN DE PUERTOSCOMO ENTRADAS Y SALIDAS AADE INICIALIZACION DE VARIABLES
LAZO PRINCIPAL
Figura 3.1 Subrutína de Inicio
3.2.1.2 Lazo Principal
Como su nombre lo indica este iazo se constituye en el punto de partida del
control del robot y es en donde el microcontrolador pasa la mayor parte del
tiempo, aquí se encuentran establecidos los tres estados primarios del prototipo
que son:
> Encendido - Apagado
> Encendido - Escuchando
> Encendido - Explorando
El Encendido - Apagado es el estado en que el prototipo esta energizado pero
en reposo es decir no atiende a ninguna palabra u orden de control hasta
recibir una activación manual por parte del usuario mediante un pulso en el
botón ON/OFF, si bien este estado consume energía que al parecer es
innecesaria, permite que el prototipo tenga tiempo para inicializar e!
posicíonamiento de sus partes constitutivas como son; la cámara que índica al
76
usuario en donde se encuentra el robot y la pinza que permite tomar objetos del
medio externo en e! cual se encuentre, de igual manera ofrece el tiempo
necesario e indefinido para la calibración del receptor que se utiliza durante el
proceso de exploración (sintonización del canal en el TV ), así como también
permite sí es el caso borrar y reprogramar las palabras u ordenes de acción
dentro del Voíce Direct, teniendo en cuenta que dichas ordenes podrán tener
otro nombre, más la acción de control será la misma.
Una vez realizada todas las calibraciones necesarias para obtener una señal
nítida en el receptor y haber grabado todas las quince instrucciones para el
funcionamiento del prototipo se pulsa el botón ON/OFF, aquí el
microcontroíador empieza su funcionamiento especifico en donde entra en
modo de escucha continuo e identifica cualquiera de las palabras u ordenes de
acción que lo llevan a su último estado, el de exploración propiamente dicho.
El Encendido - Escuchando es el estado en el que el microcontroíador
paraliza su actividad para esperar una orden o nueva orden del usuario, en
este momento el prototipo deja la exploración y únicamente espera que se
ingrese una palabra u orden de acción, el motivo de dejar al robot sin
movimientos es para proteger su integridad en el caso de que la palabra
ingresada por el usuario no sea reconocida como correcta en primera instancia
y sea necesario un segundo intento de reconocimiento.
Una vez que alguna palabra u orden de acción sea ingresada por el usuario el
prototipo sale de este modo e ingresa al modo de exploración.
El Encendido - Explorando es el estado en el que el microcontroíador esta
apto para identificar cualquiera las quince palabras u ordenes de control que
conforman las funciones de exploración del robot, así el microcontroíador
verificará una a una todas las posibles palabras u ordenes de acción dadas por
el usuario y al identificar alguna de ellas como acertada realizará la subrutina
de acción asociada a dicha orden, de lo contrario regresará al modo de
Encendido - Escuchando para esperar una nueva palabra del usuario.
77
Cabe señalar que el robot puede ser apagado en cualquier momento y en
cualquier modo en que se encuentre pulsando nuevamente el botón ON/OFF
que deja al prototipo en modo Encendido -Apagado.
LAZOPRINCIPAL
COMPRUEBAENCEDIDO
REVISA SIINGRESAORDEN
SALTA AIDENTIFICAR
PALABRA
SALTAASUBRUTINADE ACCIÓN
Figura 3.2 Subrutina de Lazo Principal
3.2.1.3 Identificación de Palabras u Ordenes
Esta parte del programa se ocupa de identificar correctamente las quince
palabras u ordenes de control que intervienen en el funcionamiento del
prototipo, llevándose a cabo únicamente cuando el mismo se encuentra en
estado Encendido - Explorando que es el estado que permite tener e! completo
control del robot. Para realizar la identificación de las palabras el
78
mícrocontrolador revisa pin a pin el estado de su pórtico de entrada hasta
conseguir una identificación acertada que lo llevará a las subrutinas de acción
Para realizar el manejo del robot se tiene quince palabras u ordenes de control
preestablecidas y almacenadas en el VOICE DIRECT que podrán ser borradas
y reprograrnadas al gusto del usuario en cualquier momento, más el orden de
cada una de estas dentro del microcontrolador llevan al prototipo hacia una
subrutina de acción específica y única que no puede ser alterada por el
usuario. Todas estas subrutinas de acciones específicas y únicas se escriben a
continuación:
Tabla 3.1 Palabras u Ordenes de Control
PALABRASPREESTABLECIDA
AUTOMÁTICO
ADELANTE
ATRÁSDERECHA
IZQUIERDAPASOS
AREBAABAJOMEDIO
FRENTE
POSTERIORABRIR
CERRARVERTICAL
HORIZONTAL
SUBRUTJNA DE ACCIÓNEL ROBOT EXPLORA AUTOMÁTICAMENTE
ACTIVA MOTORES DC ADELANTE
ACTIVA MOTORES DC ATRÁSACTIVA MOTORES DC DERECHA
ACTIVA MOTORES DC IZQUIERDAACTIVA O DESACTIVA MOVIMIENTOS DEL
ROBOT PASO APASOMUEVE CÁMARA ARRIBAMUEVE CÁMARA ABAJOMUEVE CÁMARA MEDIO
MUEVE CÁMARA AL FRENTE
MUEVE CÁMARA HACIA ATRÁSABRE LA PINZA
CIERRA LA PINZAMUEVE LA PINZA VERTICALMENTE
MUEVE LA PINZA HORIZONTALMENTE
SA
LTO
AS
UB
RU
TIN
A. D
EA
CC
ON
Fig
ura
3.3
Sub
rutin
a Id
entif
icac
ión
de P
alab
ras
vo
SA
LTO
AS
UB
RLm
|\ÍA
DE
AC
CÍO
N
SALT
O A
SU
BR
UTI
NA
DE
AC
CO
N
Con
tinua
ción
Fig
ura
3.3
co o
w>
SALT
O A
SU
BR
UT1
NA
DE
AC
CO
N
SA
LTO
AS
UB
Rlm
NA
DE
AC
CO
N
00
Con
tinua
ción
Fig
ura 3
.3
82
Dentro del diagrama de flujo se utiliza como nomenclatura de cada orden de
acción la palabra 1 hasta la palabra 15, esto indica que la instrucción puede
tener cualquier nombre dado por el usuario, mas su reconocimiento tiene-un
orden especifico dentro del software y lleva a una única acción de control en el
robot, este orden especifico se detalla continuación:
Tabla 3.2 Acción de control de cada palabra
NUMERO DEPALABRAPAL ABRA 1PALABRA 2
PALABRAS
PALABRA 4PALABRAS
PAL ABRA 6PALABRA?PALABRASPAL ABRA 9
PALABRA 10PALABRA 11
PALABRA 12PALABRA 13PALABRA 14PALABRA 15
SUBRUTINA DE ACCIÓNEL ROBOT EXPLORA AUTOMÁTICAMENTEACTIVA 0 DESACTIVA MOVIMIENTOS DEL
ROBOT PASO A PASO
MUEVE CÁMARA ARRIBA
MUEVE CÁMARA ABAJOMUEVE CÁMARA MEDIO
ACTIVA MOTORES DC ADELANTEACTIVA MOTORES DC ATRÁS
ACTIVA MOTORES DC IZQUIERDAACTIVA MOTORES DC DERECHA
ABRE LA PINZACIERRA LA PINZA
MUEVE LA PINZA HORIZONTÁLMENTEMUEVE LA PINZA VERTICALMENTE
MUEVE CÁMARA AL FRENTEMUEVE CÁMARA HACIA ATRÁS
3.2.1.4 Subrutinas de Acción
Esta parte del programa es la encargada de manejar los periféricos de salida
del microcontrolador, los cuales manejan a los actuadores que permiten el
correcto desempeño del prototipo. Así se tiene:
> SUBRUTINA DE ACCIÓN AUTOMÁTICO
> SUBRUTINAS DE ACCIÓN MANUAL
La SUBRUTINA DE ACCIÓN AUTOMÁTICO esta diseñada para controlar los
movimientos de! prototipo de manera autónoma guiando los mismos de
acuerdo al estado de los ojos electrónicos (sensores infrarrojos) que
83
proporcionan la información necesaria para evadir obstáculos o abismos dentro
de la trayectoria de exploración del robot.
El movimiento que realiza el robot es siempre hacia adelante; evadiendo
obstáculos y abismos durante su trayectoria mediante giros de su estructura
hacia la derecha o izquierda sobre su propio eje de manera aleatoria, los
mismos que duran hasta que todos los ojos electrónicos (sensores infrarrojos)
indiquen un camino seguro para el recorrido.
REVIZARSENSOR FRONTAL
OBSTAOLO
1
X
r
nove?ROBOT
ADB.ANTE
Figura 3.4 Subruíína de Acción Automática
84
Las SUBRUTINAS DE ACCIÓN MANUAL son las encargadas de realizar la
labor puntual que indique la palabra u orden reconocida por el sistema como
correcta dada por el usuario y funcionan como interruptores de los actuadores,
es decir activan directamente un conjunto de los mismos en una secuencia
determinada dando como resultado una acción física del prototipo.
Estas son:
• Movimientos del robot
• Movimientos de la pinza y
• Movimientos de la cámara
SUBRUTINADE
ACCIÓN DEL MODOMANUAL
ACCIÓN PUNTUAL DADA
POR EL USUARIO
REGRESAR
Figura 3.5 Subrutína de Acción del Modo Manual
Los Movimientos del Robot están dados por el accionamiento de 2 motores
DC, uno para cada flanco, permitiéndole al prototipo girar sobre su propio eje,
es decir en espacios reducidos.
85
Los Movimientos de la Pinza se realizan enviando un tren de pulsos hacia los
servomotores que controlan la misma, la posición esta dada por el ancho de!
pulso y sus giros son de hasta un ángulo de 180° como máximo.
Los Movimientos de la Cámara de igual manera que la pinza se realizan por
medio de dos servomotores y su control esta dado por la relación de trabajo de
un tren de pulsos a sus terminales.
3.3
El manejo de los periféricos dentro del programa constituye la base del
funcionamiento del robot pues permite distribuir todos los pines del
microcontrolador hacia los actuadotes o salidas dependiendo del estado de los
sensores o entradas.
Dentro del programa existen periféricos múltiples, es decir que permiten el
ingreso de varias señales por una misma línea de entrada, en otras palabras se
utiliza una ampliación de puertos con la ayuda de buffers. Al realizar las
ampliaciones de puertos se consigue extraer el máximo provecho de las
utilidades del microcontrolador aunque esto influya un poco en la complejidad
del programa, razón por la cual en la mayoría de los casos el programador
prefiere usar un microcontrolador de mayor numero de Entradas / Salidas.
Dentro de los periféricos de entrada están los sensores infrarrojos que son del
tipo ON/OFF y entregan una señal de uno lógico o cero lógico al
microcontrolador, encargado de discernir las acciones que se deben tomar de
acuerdo al estado de cada uno de estos sensores. De igual manera ocurre con
el sensor de final de carrera de la pinza que indica la existencia de un objeto
dentro de sus paredes, permitiendo que el microcontrolador sujete al objeto sin
maltratarlo.
En el siguiente capítulo se habla de las pruebas y resultados que se obtuvieron
durante el proceso de ensamblaje y puesta en funcionamiento del robot.
86
CAPITULO 4
4 PRUEBAS Y RESULTADOS
4.1 PRUEBAS
Durante el desarrollo del proyecto se hicieron pruebas del funcionamiento del
prototipo para obtener al final el mayor rendimiento de la energía, la mayor
rapidez en el control y la mejor calidad de transmisión desde el robot y hacia el
mismo. Para todas las pruebas realizadas se usaron criterios basados en tres
parámetros importantes que debe cumplir el prototipo; eficiencia del sistema de
exploración, confiabilidad del sistema, costo del proyecto.
Primeramente la energía que utiliza eí robot es independiente para cada área
del mismo, y se la implemento de esta manera luego de experimentar con cada
función que cumple, observando cual de estas es más crítica y por ende
necesita ser tratada de manera especial en caso de descarga de baterías. Para
conocer el consumo de cada área se realizó una prueba que indica cuanta
energía necesita cada elemento que conforma el robot, y el tiempo aproximado
de funcionamiento que tiene utilizando las baterías recargables de 1.5 V a
1800mA utilizadas en el proyecto.
Los resultados de esta prueba se describen el la tabla 4.1 y fueron tomados
asumiendo que cada elemento posee una fuente independiente de 1800mA
Tabla 4.1 Consumo de Energía en cada área de trabajo del Robot
Área
Tarjeta de
Control y Kit de voz
Tarjeta de
recepción de datos
Voltaje de
Alimentación
5M
Consumo
Mínimo
110mA
Consumo
Máximo
140mA
Tiempo
Estimado
20horas
87
y audíoi
Motores DC
Servomotores DC
Sensores infrarrojos
Transmisor de
Audio y Video
5M
5M
5M
5[V]
700mA
100mA
450mA
100mA
1200mA
500mA
450mA
100mA
2horas
Ghoras
4horas
18horas
Como se puede observar existe diversidad de consumo en cada área de
trabajo del robot, siendo como se dijo anteriormente unas áreas más críticas
que otras. Para la distribución de las fuentes de alimentación se realizó un
estudio analizando que áreas y porque son más críticas que otras así:
Tabla 4.2 Áreas Criticas de trabajo del Robot
Área
Tarjeta de
Control y Kit de
voz
Motores DC
Servomotores
DC
Sensores
Infrarrojos
Transmisor de
Audio y Video
Receptor de
Audio y Datos
Nivel de Importancia
Muy
Critico
X
X
X
Critico
X
No muy
Critico
X
X
Razón
Siempre se debe tener comunicación
con el robot para tratar de ayudarlo en
caso de fallas
En caso de fallas es importante que
se pueda mover al robot para traerlo
de vuelta mas no es lo más
importante
En caso de fallas no interesa que
recoja objetos o mueva la cámara a la
posición frontal
Los sensores pueden quedar sin
energía en caso de averías y esto no
afectara al funcionamiento del robot
Se requiere una Imagen del lugar
donde esta el robot para poder
encontrarlo en caso de averías.
En caso de averías estos elementos
son la única forma de tener
comunicación con eí robot
De acuerdo con este estudio y con el consumo que tiene cada área de trabajo
del robot se realizó la división de fuentes de energía, teniendo en cuenta que
las áreas más criticas llevan fuentes independientes para garantizar que su
funcionamiento sea el correcto y no se vea afectado por el consumo de otras
áreas menos importantes en el caso de existir descargas de batería.
En ía tabla 4.3 se especifica la distribución de las fuentes de energía en cada
área de trabajo del robot.
Tabla 4.3 Distribución de Baterías dentro del robot
Área
Tarjeta de Control y
Voice Direct
Receptor de datos y
audio
Motores DC c/u
Servomotores DC
Sensores Infrarrojos
Transmisor de Audio
y Video
Numero de Baterías
Voltaje
Packl
1.5*4=-6[V]
Pack2
1.5*4=6[V]
PackS
1.5*4=6[V]
Pack4
1.5*4=6[V]
PackS
1.5*10= 13[V]
Corriente
1800mA
1800mA
1800mA
1800mA
1800mA
Tiempo Estimado
17 horas
2horas
2horas
2horas
18horas
En lo que tiene que ver con la carga de las baterías se lo debe hacer luego de
que el robot haya funcionado el tiempo estimado de 2 horas a máximo
desgaste o 4 horas con uso intermitente y por un promedio de 4 horas tanto
para las fuentes de 6 [V] como para la fuente de 12[V].
A continuación se habla de lo referente a la rapidez de la respuesta del control
para lo cual se hizo pruebas en el prototipo para llegar a optimizar los tiempos y
89
conseguir que el robot funciones lo más rápido posible después de recibir una
orden.
En la tabla 4.4 se indica el resultado de las pruebas de la rapidez con que el kit
de voz reconoce una palabra
Tabla 4.4 Tiempo de respuesta del kit de reconocimiento de voz
Acción
Requerimiento de
Palabra
Palabra del usuario
Requerimiento de
Repetición(Ocasional)
Reingreso de Palabra
del usuario
Confirmación del
Reconocimiento
Total
Tipo de orden del usuario
Normal o
Acertada
2.5[s]
2.5[s]max.
2.5[s]
2.5[s]max
2[S]
8-1 2 [s]
Errónea o
Equivocada
2.5[s]
2.5[s]max.
2.5[s]
2.5[s]max
2[s]
8-1 2 [s]
Vacía o
Sin instrucción
2.5[s]
-
2.5[s]
-
2[s]
7[s]
Como se observa en la tabla el tiempo de respuesta del reconocimiento de la
palabra u orden del usuario varia entre 8 y 12 segundos por lo que es sistema
no es muy rápido, más el proceso no amerita mayor rapidez ya que la
exploración y los movimientos son de manera pausada y no necesitan
velocidad sino precisión.
Cabe señalar que por las pruebas realizadas con el kit de reconocimiento de
voz y las característica técnicas que este proporciona es recomendable no
utilizar palabras fonéticamente similares, así como también palabras muy
largas o muy cortas es decir de una silaba o de más de 3 sílabas; todo esto
para evitar errores o falsos reconocimientos por parte del Voice Direct.
90
Por ultimo se hablará de la transmisión de imagen y audio hacia el usuario,
esta parte constituye la de mayor conflicto dentro del desarrollo del proyecto,
ya que las pruebas de distancia de transmisión sobre los equipos arrogaron los
datos que se describen en la tabla 4.5
Tabla 4.5 Alcance de ios elementos transmisores del robot
Trasmisor de Audio y
video
Trasmisor de Audio
para instrucciones
Trasmisor de Datos
para instrucciones
distancia
Real
20m
5m
7m
Dada por el Fabricante
150m
20m
10m
Como se puede observar los datos obtenidos realmente indican una diferencia
muy alta con respecto a los datos del fabricante, esto se debe a la calidad de
los equipos ya que ai ser genéricos y de bajo costo no ofrecen las garantías
que si las brindan equipos especializados y de un mayor valor; mas por tratarse
de un prototipo en e! cual la distancia de transmisión no es un aspecto critico se
dejaron estos equipos con las características reales que presentaron.
4.2 RESULTADOS
Se ha construido un Robot innovador en el país, capaz de obedecer a
comandos de voz, enviar una imagen de su posicionamíento y también de
recoger objetos dentro de su exploración.
Este adelanto robotico nunca antes desarrollado en nuestro país consta de las
siguientes partes constitutivas.
> Tarjeta madre de control o cerebro de robot, montada dentro del chasis
del vehículo y encargada del control total de los movimientos del
prototipo, esta formada por un mícrocontrolador PIC de 28 pines que de
91
manera inteligente conduce ai robot hacia la exploración según las
ordenes del usuario
Figura 4,1 tarjeta de control
> Kit de reconocimiento de voz (Voice Direct), montado sobre la tarjeta de
control y encargado de realizar el reconocimiento de las palabras u
ordenes del usuario, así como también permite almacenar los comandos
de voz que identifican dichas ordenes. Esta formado por un
microcontrolador RSC-300 de la sensory que gobierna el reconocimiento
de las palabras constituyéndose en una ¡nterfaz entre el usuario y el PIC
Figura 4,2 Kit de reconocimiento de voz
92
Transmisor de Audio y Video montado en la parte superior del chasis del
vehículo es el encargado de transmitir la imagen del lugar donde el robot
esta realizando la exploración, asi como transmitir el audio del kit de
reconocimiento de voz para conocer si el mismo fue acertado o no. Este
elemento no fue implementado en el proyecto únicamente se lo incluyó
como componente o medio de transmisor en el cual se ingresan señales
de video de ia cámara y el audio de! kit y este a su vez transmite hacia
el receptor en !a banda de UHF.
ESí
Figura 4,3 Transmisor de video
Cámara infrarroja de video, montada sobre servomotores que a su vez
se encuentran encima de unas bases de aluminio en io alto del robot. Su
principal función es la de transmitir la imagen hacia el usuario sin
importar la oscuridad del ambiente ya que posee visión nocturna,
transmite una señal UHF.
93
Figura 4.4 Cámara de Infrarroja de video
> Pinza recoge objetos, montada en el extremo posterior dei robot, es la
encargada de recoger objetos de mediano peso para transportarlos
hacía el exterior del medio de exploración esta formada por una
estructura de acrilico y dos servomotores que permiten 2 grados de
libertad en los movimientos de la misma.
Figura 4.5 Pinza recoge objetos
94
> Panel de transmisión y grabación de ordenes, este es el panel que esta
con el usuario y por medio de! cual el mismo hace uso dei explorador
grabando ordenes o enviando las mismas para ser reconocidas. Posee
cinco pulsadores, uno para encender al robot, el segundo para ingresar
una orden al robot, el tercero para ingresar una orden a la memoria del
kit de reconocimiento de voz, e! cuarto para resetear al kit en caso de
ser necesario y ei quinto para borrar la memoria dei kit de
reconocimiento de voz.
-.-:-• ..-i.--.-Vj / v• í'-tf'WK " ' -' f 1u..; ~::-¿Ky~M¿a,.\rtr.-í -.
Figura 4.6 Control Remoto
4.3 LISTADO DE ELEMENTOS Y COSTOS
A continuación se presenta un listado con ios elementos utilizados en e!
presente proyecto y el costo de los mismos en dólares americanos:
Tabla 4.6 Listado de elementos de la tarjeta madre con costos.
Elemento
Mícrocontrolador pie 16F876Cl 74LS373CI 74LS244CI74LS04Cl 74LS32Cristal 4MhzPulsadorCapacitores 0,1 uFCapacitores 22 nFTerminales de salidaCircuito impresoResistencia 1Kohm
Cantidad
121221142811
costo/unidad
$10,00$1,00$1,00$0,40$0,50$0,40$0,20$0,10$0,10$0,05
$10,00$0,02
Total
CostoTotal
$10,00$2,00$1,00$0,80$1,00$0,40$0,20$0,40$0,20$0,40
$10,00$0,02$26,42
Tabla 4.7 Listado de elementos del sistema de sensores con costos
Elemento
Cl IS471FResistencia 100 ohm.Led emisor de luzCapacitores 0,1 uFTerminales de salidaCircuito impresoTransistor Tip1 20Transistor 2N3904Resistencias 1KohmCircuito impreso*
Cantidad
9994991131
costo/unidad
$4,00$0,02$0,50$0,10$0,02$1,00$0,40$0,10$0,03$2,00
Total
CostoTotal
$36,00$0,18$4,50$0,40$0,18$9,00$0,40$0,10$0,08$2,00$52,84
*Circuito impreso utilizado también en la desconexión de los servomotores
Tabla 4.8 Listado de elementos del sistema de servomotores con costos
Elementos
ServomotoresPinza (incluida servomotores)Soporte para servomotoresSoporte para pinzaTransistor TIP1 20Transistor 2N3904Resistencia 1 KohmTerminales de salida
Cantidad
2111113
2
costo/unidad
$17,00$120,00$1,00$0,40$0,40$0,10$0,02$0,05
Total
CostoTotal
$34,00$120,00$1,00$0,40$0,40$0,10$0,06$0,10
$156,06
96
Tabla 4.9 Listado de elementos de la tarjeta de control de los motores DC concostos
Elemento
Relés 5V
Transistor TI P 120
Transistor 2N3904Resistencia 1Kohm; 4,7Kohm
Diodos 1N41 48Diodos 1 N4007Terminales de salida
Circuito impresoCapacitores 0,1 uF
Cantidad
22
4108
2
5
12
costo/unidad
$1,50
$0,40
$0,10$0,02$0,10
$0,15
$0,05
$5,00$0,15
Total
CostoTotal
$3,00$0,80
$0,40$0,20
$0,80
$0,30
$0,25
$5,00$0,30
$11,05
Tabla 4.10 Listado de elementos de la tarjeta de aislamiento de tierras en losmotores DC con costos
I Elemento
Opto acopladores
Resistencia 1 KohmCircuito impreso
Cantidad
4
8
1
costo/unidad
$0,80
$0,02$4,00
Total
CostoTotal
$3,20
$0,16$4,00
$7,36
Tabla 4.11 Listado de elementos del sistema de baterías con costos
Elemento
Baterías 1,2 Voltios 1800mA
Baterías 1,2 Voltios 1300mA
Terminales para cargaTerminales de conexión de bateríasInterruptores
Cantidad2010
2
105
costo/unidad
$1,80
$2,20
$0,25
$0,05$0,25
Total
CostoTotal
$36,00
$22,00$0,50
$0,50
$1,25
$60,25
Tabla 4.12 Listado de elementos Sistema de transmisión de audio y video con
costos
Elemento
Transmisor de UHFCámara monocromática con luzinfrarrojaTerminales de conexión
Cantidad
1
14
costo/unidad
$40,00
$70,00
$0,05Total
CostoTotal
$40,00
$70,00$0,20
$110,20
97
Tabla 4.13 Listado de elementos Sistema de Recepción y Transmisión dedatos con costos
Elemento
Transmisor y receptor de datosTransistores 1 N3904Leds indicadoresTerminales de conexiónPulsadoresFuente de alimentación de 8VInterruptoresCaja para transmisor de datosCircuito impreso
Cantidad
144441211
costo/unidad
$11,00$0,10$0,40$0,05$0,25$4,00$0,25
$10,00$3,00
Total
CostoTotal
$11,00$0,40$1,60$0,20$1,00$4,00$0,50
$10,00$3,00
$31,70
Tabla 4.14 Listado de elementos Sistema de Recepción y Transmisión deaudio con costos
Elemento
Micrófono con receptorCircuito para reducir voltaje a 1 ,5VTerminales de conexiónCaja para aislar circuito
Cantidad
1121
costo/unidad
$8,00$1,00$0,05$2,00
Total
CostoTotal
$8,00$1,00$0,10$2,00$11,10
Tabla 4.15 Listado de elementos Sistema de reconocimiento de voz concostos
Elemento
Kit de reconocimiento de vozTerminales de conexiónCaja para aislar circuito
Cantidad
161
costo/unidad
$70,00$0,05$4,00
CostoTotal
$70,00L_ $0,30
$4,00Total $74,30
Tabla 4.16 Listado de elementos de los artículos varios con costos
Elemento
Chasis para ensamblajeLeds de IluminaciónCable de bus de datosPlancha de acrílicoCircuito oscilador para luces
Cantidad
16211
costo/unidad
$75,00$0,40$0,80$3,00$3,00
Total
CostoTotal
$75,00$2,40$1,60$3,00$3,00
$85,00
Total de costo en materiales $626,28
98
Una vez presentado el costo de materiales utilizados en el proyecto, hay que
hacer un análisis de costo de investigación y desarrollo, para lo cual se toma en
cuenta el tiempo utilizado en el diseño y la construcción de todos los
componentes del vehículo. Así en la tabla 4.7 se presenta el costo de
ingeniería:
Tabla 4.17 Costos de mano de obra
Actividad
Diseño de hardwareDiseño de software
tiempo(meses)
23
Costomensual
$400,00$400,00
total
$800,00$1.200,00
Total $2.000,00
Por ío tanto el costo total estaría luego de ia suma del valor de los costos de
ingeniería y de los materias, así se tiene un costo total de $2.626,28.
99
CAPITULO 5
5 CONCLUSIONES Y RECOMENDACIONES
• El robot explorador tipo oruga controlado por voz es una realidad y
permite recorrer caminos difíciles para otro tipo de vehículo, así como
recoger muestras del lugar de exploración. Su costo es relativamente
alto ya que esta constituido por elementos y partes no existentes dentro
del mercado ecuatoriano, más si se compara el mismo con el del único
modelo de robot similar actualmente como es el Spírit(USA) se puede
decir que es muy barato.
Se ha comprobado que el reconocimiento de voz es una gran
herramienta que no ha sido desarrollada aun en nuestro país, y que
ofrece una verdadera comunicación directa y confiable entre el hombre y
la maquina, cosa que antiguamente se constituía en un sueño, ya que la
manera de comunicación con la maquina era por medio de interfaces
gráficas, botones o hmi's que necesitaban de acciones físicas del
usuario. Mas ahora se puede controlar a todo tipo de maquinaria por
medio de nuestra voz y con palabras comunes como si se estuviera
hablando con un operario más dentro de la industria.
Este sistema de exploración posee ventajas sobre los otros sistemas
existentes, pues en este caso el usuario no necesita más que su voz
para poder realizarlo, permitiendo de esta manera la libertad de tener las
manos ocupadas en otra actividad si eso se requiere, o lo que es mejor
permite que sea manejado por personas físicamente discapacitadas que
sin este sistema nunca pudieran ser tomadas en cuenta para dicho
proceso.
100
Dentro del prototipo no se implanto un circuito indicador del estado de
las baterías ya que el robot por lo general estará lejos del usuario y este
no tendrá la capacidad de observar este indicador ni siquiera por medio
de la cámara pues es a blanco y negro, por esta razón se prefirió dar un
tiempo estimado de funcionamiento basado en las pruebas, que será de
mayor utilidad para conocer cuando y cuanto tiempo el robot podrá
funcionar eficientemente y así mismo que tiempo deberá ser recargado
de energía antes de una nueva exploración.
Se puede mejorar el sistema corrigiendo la única falencia actual del
robot que es el alcance, con un transmisor de mayor potencia y mejores
características que el implementado actualmente; esto brindaría la
posibilidad de enviar al explorador a varios kilómetros de distancia,
pudiendo ser utilizado para explorar partes peligrosas como zonas de
derrumbes o zonas con explosivos.
La respuesta del control no es rápida y se debe a la programación de
fábrica con la que viene el RSC-300 dentro del kit de voz, a pesar de
esta lentitud esto se compensa con el alto grado de amigabilidad que
posee el sistema, ya que el usuario llega a familiarizarse mucho con el
robot. De todas maneras para evitar que esta demora del
reconocimiento de las palabras u ordenes afecte al prototipo se
desarrollo en el software la condición de que el robot deje su actividad y
se quede inmóvil al recibir la señal de ingreso de palabra u orden de
acción.
Para futuros proyectos que utilizan transmisión de audio y video se
recomienda utilizar equipos de mejor calidad que no presenten
interferencias y que brinden el alcance esperado pues este fue el único
101
inconveniente que se presento durante el desarrollo del proyecto; así
mismo se espera que este prototipo sea eí pionero en la investigación
del manejo de la voz en el país, área en la que lastimosamente no existe
ningún tipo de desarrollo.
Se recomienda seguir trabajando con el microcontrolador RSC-300 de la
sensory que posee grandes cualidades entre ellas la del manejo de la
voz, muchas de estas cualidades no se las pudieron usar en todo su
esplendor en el robot, pero sin duda constituyen un potencial de trabajo
e investigación; para lo cual se requieren herramientas como son el
ensamblador y el hardware de programación, que lastimosamente no
existen en el país en la actualidad.
Para el manejo correcto del prototipo se recomienda leer el manual de
usuario que se encuentra en el Anexo A para evitar de esta manera un
mal uso del robot que lo llevaría a un deterioro temprano y lo que es
peor a una mala exploración del medio.
Por ultimo se logro contribuir con el avance tecnológico del Ecuador,
creando un robot acorde con los avances científicos del nuevo milenio;
se espera que esto sirva de ejemplo para generaciones futuras, ya que
con esfuerzo y dedicación se pueden cumplir todas las metas trazadas.
102
REFERENCIAS BIBLIOGRÁFICAS
[1] http://w\AW.euskalnet.net/iosus/speech/recoq.html
Ron Colé, "Aplicaciones de reconocimiento de voz", Oregon Instituto,
2000
Revisado 15/03/2004
Esta página trata sobre ei tipo de reconocimientos que se han
establecidos hasta la actualidad (primera parte).
[2] http://www.euskalnet.net/iosus/speech/recog.htmi
J.M. Montero*, J. Gutiérrez-Arriola*. J. Colas*, J. Macías-Guarasa*, E.
Enríquez**, J.M. Pardo*, "desarrollo de un sintetizador de habla en
español", Universidad Politécnica de Madrid
Revisado 10/03/2004
Esta página trata sobre el tipo de reconocimientos que se han
establecidos hasta la actualidad (segunda parte).
[3] http://www.euskalnet.net/iosus/speech/recoq.html
Ing. Andrés Flores Espinoza, "Reconocimiento de voz", Octubre 1998.
Revisado 10/03/2004
Esta página trata sobre las técnicas que se utilizan para realizar el
reconocimiento.
[4] http://www.euskalnet.net/iosus/speech/habla.html
Revisado 10/03/2004
Esta página trata sobre como el proceso reconoce al hablante.
[5] http://www.euskalnet.net/iosus/speech/habla.html
Revisado 10/03/2004
Esta página trata sobre como el proceso reconoce al hablante.
[6] http://www.euskalnet.net/iosus/speech/recQq2.html
Revisado 10/03/2004
Esta página trata sobre el reconocimiento de la voz.
[7] http://www.euskalnet.net/iosus/speech/recoq2.html
Revisado 10/03/2004
Esta página trata sobre como se hace un modelo del tracto vocal.
f103
[8] http://www.sensorvinc.com/htmi/products/rsc364.html
http://www.sensorvinc.com/
Revisado 05/02/2004
Especificaciones del kit de reconocimiento de voz
[9] Hoja de especificaciones técnicas del microcontrolador RSC 300/364 de la
sensoryinc
^ Vigente desde 2002, fabricado por la Sensory.inc, Adquirido en Jameco,
tiene 42 hojas de características técnicas.
[10] Hoja de especificaciones técnicas del Voice Direct II , "speech
recognition kit "de la sensoryinc
[11] Hoja de especificaciones técnicas del Sensor Infrarrojo SHARP ISF471
Daniel Martín, "sensores", 2001-2004
[12] http://www.sapiensman.com/color digital/
Revisado 24/04/2004
Esta página trata sobre los métodos que utilizan los sensores de vídeo
para digitalizar las imágenes.
[13] http://www.ii.uam. es/~mecatron/índex.php3
I Revisado 20/04/2004
Presenta algunos proyectos de sistemas robóticos construidos en la
Universidad Nacional de Colombia. Muestra la forma de construcción del
robot observer
[14] http://www.nasa.com
Revisado 20/04/2004
Presenta la hoja con los trabajos de la NASA
[15] Nelson Sotomayor, L Andrango, "Simulación y Ensamblaje de un
Prototipo para control y navegación de un robot móvir, EPN, 1999.
104
ANEXOS
A continuación se enlistaran una serie de posibles fallas en el funcionamiento
normal del robot, así como las soluciones para mantenerlo siempre funcionado
correctamente.
FALLA
• No hay recepción clara de la señal emitida por el robot
SOLUCIÓN
• Puede ser que la antena no este levantada, o que a su vez esta fue
removida de su lugar, lo que produce una pésima recepción. Además'es
posible que el canal receptor no se encuentre bien sintonizado. Favor
sintonizar bien el receptor o a su vez el transmisor del vehículo.
FALLA
• Existe recepción en video pero no en audio.
SOLUCIÓN
1. El control remoto no esta encendido, proceda a encenderlo.
2. El plug de salida de audio del kit de reconocimiento de voz esta
desconectado. Proceda a conectaren la posición indicada.
FALLA
• La orden de voz llega al robot, pero éste no realiza la orden.
SOLUCIÓN
• El robot esta apagado. Proceda a encenderlo presionando el botón 3 del
control remoto, de esta forma el robot colocara la cámara y la pinza en
posición inicial, entonces podrá receptar ordenes.
FALLA
• El robot esta en modo automático. Y empieza a girar en círculo.
SOLUCIÓN
1. El robot esta con una oruga trabada. Por favor gire la oruga de modo
que esta saiga de! bloqueo,
2. Uno de los sensores esta desconectado, la señal no llega
correctamente a la tarjeta madre, proceda a revisar la conexión de
cada uno de los sensores, de esta forma todas las señales llegaran a
la tarjeta.
3. La batería de una de las orugas esta descargada. Proceda a cargar
las baterías.
FALLA
• El transmisor esta encendido pero la señal del robot no aparece.
SOLUCIÓN
• Se necesita sintonizar correctamente el canal en el receptor de televisión,
Recuerde que la señal de transmisión esta en UHF, así que el usuario
puede encontrar en esta banda la señal transmitida.
FALLA
• El transmisor no enciende.
SOLUCIÓN
• La batería del mismo esta descargada. Favor proceder a cargar con el
voltaje especificado.
FALLA
• El robot enciende pero los servomotores no se accionan.
SOLUCIÓN
1. Los interruptores de carga de batería están en modo carga (posición
OFF) procederá colocarlos en posición ON.
2. Las baterías están descargadas, proceder a cargarlas de acuerdo a
lo antes mencionado.
Nota
Esta falla puede afectar también a los sensores, por lo que se debe proceder a
colocar en posición ON el interruptor 3
FALLA
• El robot esta en modo automático. Y existen objetos que no los esquiva.
SOLUCIÓN
• Cuando la manipulación de vehículo es constante los sensores tienden a
moverse de su posición original. Por lo que pierde la capacidad de divisar
todos los obstáculos que se puedan atravesar en su camino. Por lo que se
debe enderezar los soportes de los sensores para que estos vuelvan a
detectar los obstáculos dentro de la trayectoria explorada.
FALLA
• El usuario presiona el botón 2 del control remoto, y el robot responde
"memoria borrada"
SOLUCIÓN
. Debido a que el transmisor de datos del robot, es uno convencional, y se
encuentra en badas de trabajo común en el medio, puede ser que se filtren
señales y el robot las entienda como ordenes, entonces este procederá a
realizarlas de acuerdo a lo ya programado, Y en este caso a borrar la
memoria. Entonces se solicita al usuario cargar nuevamente la lista de
palabras en el orden ya descrito en capítulos anteriores.
FALLA
• La pinza no siente objeto el momento de cerrar.
SOLUCIÓN
• El sensor de fin de carrera de la pinza esta desconectado y la misma no
reconoce un objeto. Proceda a revisar este sensor. Recuerde que el mismo
se encuentra conectado en el pin 2 del conector numero 9.
ANEXO BCIRCUITOS IMPRESOS Y
ELEMENTOS UTILIZADOS
Figura B - 1 Tarjeta madre lado A
Figura B ~ 2 Tarjeta madre lado B
*+
3-so *»+
O
O O
«P'sfc»
v«r
g
"o
o »
o oo «4
€*e -O
IHO
Figura B - 3 Ubicación de los elementos de ia tapeta madre
Los elementos que están utilizados en la tarjeta son los siguientes:
ElementoMicroconírolador pie 16F876CI74LS373Cl74LS244CI74LS04CI74LS32Cristal 4MhzPulsadorCapacitores 0,1 uFCapacitores 22 nFResistencia 1 Kohm
Cantidad1212211421
Figura B - 4 Tarjeta de acondicionamiento de las señales del transmisor de datos
JP2
lR1
R12
Figura B - 5 Ubicación de los elementos en la tarjeta
Los elementos que están utilizados en la tarjeta son los siguientes:
ElementoTransistores 1N3904Resistencias 1 KohmLeds indicadores
Cantidad5124
Figura B - 6 Tarjeta de activado de los servomotores y sensores
MtfH
Figura B - 7 Ubicación de los elementos en la tarjeta
Los elementos que están utilizados en la tarjeta son los siguientes:
ElementoTransistor 2N3904Transistor TIP120Resistencia 1 Kohm
cantidad113
Figura B - 8 Tarjeta de los sensores
(oÜJojc-i
Figura B - 9 Ubicación de los elementos en la tarjeta
Figura B - 10 Tarjeta de control de los motores DC lado A
Figura B -11 Tarjeta de control de los motores DC lado B
Figura B -12 Ubicación de los elementos en la tarjeta de control de los motores DC
Esta tarjeta cuenta con:
Relés 5V 2Transistor Ti P 120 2Trransistor 2N3904 4Resistencia 1Kohm; 4t7Kohm 10Diodos 1N4148 8Diodos 1N4007 2Capacitores O.TuF 2
ANEXO CESPECIFICACIONES TÉCNICAS
SI-MXRF» IS471F
IS471F OPIC Light Detector with Built-in SignalProcessing Circuit for Light Modulation System
• Features
1. JLmpervious to extemal disturbing lightsdue to HghtTnodulatíon system
2. Buüt-in pulse driver circuit and sync.detector circuit on the emítter side
3. A wide range of operating supply voltage(Vcc:4.5tol6V)
• Applications
1. Optoelectronic switches
2. Copiers= printers3. Facsímiles
Outline Dimensíons (Unít: mm)Internal connection diagram
Voltsge regulator
*"OPIC " (Optical 1C) !s a trademailc of the SHARP Corporanon.Aa OPIC coaslsts of a líght-deíectüig eiemcní and sígnal-processíng circuit íntcgrated onto a single cbip.
Absolute Máximum Ratings (Ta-25°C)Parameter
Supply voltage
Output
M GL oulpul
Output voltageOutput currcntOutput voltage
Power dissipaííonOperating temperatureStorage temperature
^ Soldering temperature
SymbolVccVolo
VGLP
J opc
T^TMJ
Rating-0^ to 16
1650
16250
-25to+60-40to+100
260
UnitVV
mAV
mW•c•c*C
Resin poríion
/ .— Soldering portíon/ (Immersed up to bendíng portíon)
* I Applícs lo GL un terminai*2 For 5 seconds at the positíon shown in the right figure
SHARP IS471F
Electro-óptica! Characteristics (V«r= 5V, Ta= 25°C)
Parameter
Operating supply vollage
Supply cutrent
Ouíput
GLoutput
Lowlevcl otiíput vollage
High leve! outpui voJíage
GutpiA shori circuí carenl
Low level output current
'*Pulse cycle
""Pulse width
*5"Low-íHigh " threshold irradiance
>5"High->Low" thrcshold inadiaEce
Hysteresís
Responso
time
" High—» Low"propagación dclay lime" Lo w— » High"propagación deafy time
*7 Externa! dislurbing light illumínance
Symbol
VccIce
Vor,VOH
los
IGL
ÍPtw
Eel-Líl
EePHt
E ePLH /E ePRL
tpRL
tpLH
EVDX
Condítions
-Vo, GL «i termináis shall be opead.
loL=l6mA,Evp=500lx,BvD=0'í
EVD= .Evp= 0-3
Evp= EVD= 0"J
VOL= 1.2V
-_
£eD= O'3Light croittingdiode ÍX p= 940nm )"6
*6*6Eep=7¿llWftnni2,'J).ii=940nra
MIN.4.5--
4.97
0.2S4070
4.4--
0.45--
2000
TYP. | MAX.-
3.50.15
-
0.5551308
0.4
0.70.65400400
7500
167.0
0.35-
1.0
7022013.72.66
2,80.95670670.
Unit
VmA
VV
mAmA.^s\ÍS
liW/mm2
|lW/mm2
-Jts\LS
Ix
*3 Hcp represcnts illiirainance of signal ligbt in sync with the low level timing of output a
EtD represents illumínance of DC Ught. Foc detall, see Fíg. 1.
Light source: Ijifrared Ught emittíng diode CX p= 940nm )
Evp represents illurainance of signal light ín sync wíth the low level timing of output a
terminal.
emsínal.
EVD reprcsentsilluminanceof DC Hght. Note Üiat the líght source ís CIÉ standard lígh) soiirceA.
Fig.1
Time (Note) Fig. 1 shows Ihe oulpuf waveíbrra at GL outterminal with IS471F connected as slwwn ínfíg.3.
Output wavefomiai GL out tennina!
*4 Pulse cycle(t $, pulse width (t w) are defined as shown in Fig. 2.The wavcfonnshowninFig. 2 ístbe output voUagewavcforraatGLom terminal with IS471F connectcdasshown Ín Fig. 3
Fig.2 Fig.3
5V
ov
*5 Defined as Eq, that causes the output to go" Low to High" Cor" High to Low" ).
SHARP IS471F
*6 Test círcuitfor response lime, thieshold írradiance is shown in Fig. 4.
Fig. 4Vin
Switch
Ughtemittingdiode
IS471F
-©
2BOílSwitch
GND
_Q.33nFT5V
JLight emitting diode: peakemÍssionwavelenghXj.= 940nm
*7 £ VDX-Dcfíncdas thcEvo atthcliraíl of normal opciation range.
OFF
Fig. 5 Power Dissipation vs.Ambient Temperature
250
200
50
0
\\5 0 25 50 60 75 100 i;
Ambíent lemperature T^ (*C)
Fig. 7 Low Level Output Voltage vs.Ambient Temperature
o.i
-25 O 25 50 75
Ambient temperaíure Ta ("C)
Fig. 6 Low Level Output Voltage vs.Low Level Output Current
0.1
± 0.05
0.02
0.0 1
VCC= 5VT,= 25'C
L 2 5 10 20 50 100
Low level output currcnt J QL (mA)
Fig. 8 Supply Current vs. Supply Voftage
2 4 6 S 10 12 14 16
Supply voltage Va-(V)
SHARP IS471F
Fig. 9 Low Level Output Currentvs.Supply Voltage
Fíg.10 Sensitivity Diagram (T, = 25'C)
^ 70
~ 60o
i 503 -10£•
1 30
"í 20
2 4 6 8 10 12 14 16 18
Supply voltage Vcc (V)
Fig.11 Spectral Sensitivity
JOO
90
80,
'! 50
2 40_>I 30oí
20
10
O400 500 600 700 800 900 IOOQ 1103 1200 BQQ 1400
Wavelength X (nm)
-HO* +20*
Angular displaccmaií 6
Basic Circuit
Infrared üghtemitting diode
# la ordcr lo stabi'Iize powcr supply Une, connect a by-pass capacitor ofQ33}iformorc bctwcen Vcc and GNP near the dcvícc.
i Flease refer lo the chapter "Frccautíons for Use."
(*
Vo
ice D
ire
ct™
II
Spe
ech
Rec
ogni
tion
Kit
Qu
íckS
tart
Man
ual
S E
N
S
O
R
Y
© 2
003
Senso
r/,
Inc.
P/N
80-
0240
-A
Vot
ce D
lrect
™ II
Spe
ech
Rec
og
nltl
on
Kit
Qui
ck S
tart
Man
ual
CO
iV5T
/ít/C
770A
'-..—
....
. ...M
...
....—
M
...M
.,..,..., -
-
...„...._..............«
4
OU
TPU
TS*. ....................
...................
„..,.
„...„
„ ..
, „._
.....
., .....
„.„.
,- ™
,^.~,
. ...„
-..»
............
~.................
5
SYST
EMD
ESÍG
N .
~
3
6. iM
olhe
rbna
rd a
nd M
odul
e l'l
mm
l and
Cha
ract
erli
tlu
—„.
__
.._
_-
___.
..,_
_„.
__„—
..—
_
. f>
MO
DES
ELEC
T10N
.....:.
, 9
TRAl
AND
RECO
GNf
flONS
ELEC
TJW
T}'.
—
9
MO
DU
LE P
MC
HAR
ACTE
RiST
lCS
* ¡O
7.T
rtln
lnB
Vol
ccI)
lrec
trMII
.
.. ,.
U
EDG
E-TJ
tIGG
ERED
SI
NGLE
-REC
OG
N1T1
0N (
ESR)
Í.1
0DE.
~.
U
MU
L7t-T
RlG
GER
CO
tJTl
NU
OU
SLlS
TE¿/
lNG
(f,tC
L)M
OD
E ..
12
SlN
GLE
-TRl
GG
ERW
QRD
.SP0
7TM
GM
QD
E(S»
'S)íl
tDD
E 13
EDG
&TR
IGG
ERED
SlN
GLE
-REC
OG
NffJ
QN
(ESR
) M
QD
E ,
13
StN
GLE
-TRI
GG
ERC
ON
TliV
UO
USL
lSTE
fiMG
pCLJ
MO
DE.
_
/-f
MU
Ln-T
R¡G
GER
CQ
NTI
t¿U
QU
SUST
&m
G
(MCI
) M
OD
E „
15
SING
LE-T
RJG
GER
W
ORD
-SP0
1TJN
G
(SK'
S) M
OD
E 16
10.T
.!p*
for
Opl
lttul
Per
form
ance
»™
_...,
_—
. ™
—...
.. .
......
......
...
.—„.
,_.
.17
11. S
chci
natlc
í for
Vol
ee IH
rect
™ U
Mod
ule
and
Mol
herb
o»rd
._
, ._
.„.„
.„
. .......
. „
18
13. V
olee
Dir
ect"
1 II S
|W«h
Kec
ognl
tlon
Kil
Lim
ited
War
ranf
y v
20
14. S
ENSO
RY
Sof
twar
e En
d U
wr
Licc
nse A
gree
nicn
t „_.
«.
_.
-„
, .~
.-™
_—~.
—.2
1
15.T
he I
nter
activ
eSiK
Wh^
'líro
ducl
Une
.—
.--.
23
P/N
80
-02
40
-A©
200
3 S
enso
ry I
nc.
Qul
ck S
tart
Man
ual
Vol
ee D
lrec
t™ II
Spe
ech
Reco
gnltl
on
Klt
15,
The
Inte
ract
ive
Spe
ech™
Pro
duct
Lin
eTh
e In
tera
ctiv
e S
peec
h Un
e of
)C
s an
d so
ftwar
e w
as d
evel
oped
to
"brln
g U
fe to
pro
ducí
s" t
hrou
gh a
dvan
ced
spee
ch r
ecog
nltlo
n an
d au
dio
tech
nolo
gy,
The
Int
erac
tive
Spe
ech
Pro
duct
Une
was
des
lgne
d fo
r co
nsum
er t
elep
hony
pro
duct
s an
d co
st-s
ensl
t]ve
cons
umer
ele
ctro
nlc
appl
lcat
lons
suc
h as
hom
e el
ectro
nlcs
, pe
rson
al s
ecur
lty,
and
pers
onal
com
mun
lcat
lon.
The
prod
uct
Une
Incl
udes
aw
ard-
wln
nlng
RSC
ser
les
gene
ral-p
urpo
se m
lcro
cont
rolle
rs a
nd to
ols,
SC
ser
les
ofsp
eech
mlc
roco
ntro
llers
, pl
us a
Une
of
easy
-to-
lmpl
emen
t ch
lps
that
can
be p
ln-c
onflg
ured
or
cont
rolle
d by
an e
xter
nal
host
mlc
roco
ntro
ller,
Sen
sory
's s
oftw
are
tech
nolo
gles
run
on
a va
rlety
of
mlc
roco
ntro
llers
and
DSP
s.
RSC
Mlc
roco
ntr
olle
rs a
nd T
oo
lsT
he R
SC
pro
duct
Une
con
taln
s lo
w-c
ost
8-b
lt sp
eech
-opt
lmlz
ed m
lcro
cont
rolle
rs d
eslg
ned
for
use
ln c
onsu
mer
el
ectron
es,
All
mem
bers
of
the
RS
C fa
mlly
ar
e fu
lly I
nteg
rate
d an
dIn
clud
e A
/D,
pre-
ampl
lfler
, D
/A,
RO
M, a
nd R
AM
clrc
ultr
y. T
he R
SC
fam
lly c
an p
erfo
rm a
ful!
rang
e of
spe
ech/
audl
o fu
nctlo
ns I
nclu
dlng
spe
ech
reco
gnltl
on,
spea
ker v
erlfl
catío
n, s
peec
han
d m
uslc
sy
nthe
sls,
an
d vo
lee
reco
rd/p
layb
ack.
Th
e fa
mlly
Is
su
ppor
ted
by
a co
mpl
ete
sulte
of
eval
uatlo
n to
ols
and
deve
lopm
ent
klts
,
SC M
lcro
contr
olle
rs a
nd T
ools
The
SC
-6x
prod
uct
Une
feat
ures
the
hlg
hest
qua
llty
spee
ch s
ynth
esls
IC
s at
the
low
est d
ata
rate
in t
heIn
dust
ry. T
he U
ne in
dude
s a
12.3
^ M
IPS
pro
cess
or f
or h
lgh-
qual
ity [
ow d
ata-
rate
spe
ech
com
pres
slon
and
MID
I m
uslc
syn
thes
ls, w
lth p
lent
y of
pow
er le
ft ov
er f
or o
ther
pro
cess
or a
nd c
ontr
ol f
unct
lons
, M
embe
rsof
the
5C
-6x
Une
can
sto
re a
s m
uch
as 3
7 m
inut
es o
f sp
eech
on
chlp
and
Indu
de a
s m
uch
as
64 I/
O p
lns
for
exte
rnal
Int
erfa
clng
. In
tegr
atln
g t
hls
broa
d ra
nge
of f
eatu
res
onto
a s
ingl
e ch
lp e
nabl
es d
evel
oper
s to
créa
te p
rodu
cts
wlth
hlg
h q
uallt
y, lo
ng d
urat
lon
spee
ch a
t ver
y co
mpe
tltlv
e pd
ce p
olnt
s.
Applic
atio
n S
pecl
flc S
tand
ard
Pro
duct
s (A
SS
Ps)
» V
olee
O/rect
'" II
pr
ovld
es in
expe
nsiv
e sp
eake
r-de
pend
ent
spee
ch r
ecog
nltlo
n an
d sp
eech
syn
thes
ls,
Thl
s ea
sy-t
o-us
e,
pln-
conf
lgur
able
chl
p re
qulre
s no
cus
torn
pro
gram
mln
g an
d ca
n re
cogn
lze
up t
o 15
Wor
ds I
n 4
pln-
prog
ram
mab
le m
odes
, Id
eal
for
spea
ker-
depe
nden
t co
mm
and
and
cont
rol
of h
ouse
hold
cons
umer
pro
duct
s, V
olee
Dlre
ct™
11
|s p
arí
of a
com
plet
e pr
oduc
t Un
e th
at in
clud
es th
e IC
, m
odul
e, a
ndV
olee
Dlre
ct"1
II S
peec
h R
ecog
nltjo
n K
lt,•
Vol
ee extrem
e'"
sim
pllfl
es t
he c
reat
lon
of f
ully
cus
tom
spe
ech-
enab
led
prod
ucts
by
offe
rlng
deve
lope
rs th
e ca
pabl
llty
of p
rogr
amm
fng
the
chip
In a
hlg
h-Ie
vel
C-ll
ke l
angu
age.
Pro
gram
cod
e, s
peec
h da
ta,
and
even
rec
ord
and
play
back
Info
rmat
ion
can
be s
tore
d on
asi
ngle
of
f-ch
lp
Flas
h m
erno
ry.
Bas
ed
on
Sen
sory
's
RS
C-3
64
spee
ch p
roce
ssor
, V
olee
Ext
rem
e In
clud
es
a hl
ghly
ef
flcle
nt
on-c
hlp
co
de
Inte
rpre
ter,
an
d I
s su
ppor
ted
by
aco
mpr
ehen
sive
sul
te o
f lo
w-c
ost d
evel
opm
ent
tool
s.
So
ftw
are
an
d T
ech
nolo
gy
• V
olee
Act
íva
tto
n™
mic
ro f
ootp
rlnt
softw
are
prov
ldes
adv
ance
d sp
eech
tec
hnol
ogy
on a
varle
ty
of
mlc
roco
ntro
ller
and
DS
P p
latfo
rms.
A
fle
xibl
e de
slgn
w
lth
a br
oad
rang
e of
tech
nolo
gles
al
low
s m
anuf
actu
ren
to
easl
ly
Inté
grat
e sp
eech
fun
ctlo
nallt
y In
to
cons
umer
elec
tronl
c pr
oduc
ts.
+ F
luent
Spe
ech1
" sm
all f
ootp
rlnt
soft
war
e re
cogn
lzes
up
to 5
0,00
0 w
ords
; of
fers
Anl
mat
ed S
peec
h w
lthth
e ab
lllty
to
auto
mat
e en
uncl
atlo
n an
d ar
tlcul
atlo
n; p
erfo
rms
text
-to-
spee
ch s
ynth
esls
In e
lther
mal
e or
fem
ale
vole
es;
prov
ides
nol
se a
nd e
cho
canc
ella
tlon,
per
form
s W
ords
pottl
ng f
or n
atur
al l
angu
age
usag
e;of
fers
tel
epho
ne b
arge
-ln;
and
prov
ldes
con
tlnuo
us d
lglt
reco
gnltl
on.
Import
ant
rod
ees
Rea
sona
ble
effo
rts
have
bee
n m
ade
to v
erlfy
the
acc
urac
y of
Inf
orm
atio
n c
onta
lned
her
eln,
how
ever
no
guar
ante
e ca
n be
m
ade
of
accu
racy
or
ap
pllc
ablll
ty.
Sen
sory
re
serv
es
the
rlght
to
ch
ange
an
ysp
eclfi
catlo
n or
desc
riptlo
n co
ntal
ned
here
ln.
© 2
003
Sen
sory
Inc
.P
/N 8
0-0
24
D-A
23
Vo
lca
PIrect
™ U
Sp
eech
Rec
og
nlt
lon
Kit
Qui
ck S
tart
Man
ual
foun
d to
hav
e fa
lied
of it
s es
sent
ía)
purp
ose,
(a)
Sen
sory
's to
tal l
labl
lity
to y
ou fo
r ac
tual
dar
nage
s fo
r an
y ca
use
wha
tsoe
ver
will
be
limlte
d to
the
gre
ater
of
$500
us d
olla
rs o
r th
e am
ount
pal
d by
you
for
the
softw
are
that
cau
sed
such
dar
naae
.(b
) (U
SA
onl
y)
som
e st
ates
do
not
aito
w t
he l
lmita
tion
or
excl
usió
n of
lla
bilit
y fo
r In
cide
ntal
of
con
sequ
entla
lda
mag
es,
so t
he a
bove
tfm
itatfo
n or
exd
uslo
n m
ay n
ot a
pply
to
you
and
you
may
als
o ha
ve o
ther
leg
al r
tght
sth
at v
ary
from
sta
te to
sta
te,
9.
Bat
ís o
f Bar
galn
The
Um
lted
War
rant
y, E
xdus
ive
Rem
edie
s an
d U
mite
d U
abitl
ty s
et f
orth
abo
ve a
re fu
ndam
enta
l el
emen
ts o
f th
e ba
sls
ofth
e ag
reem
ent
betw
een
Sen
sory
and
you
, S
enso
ry w
ould
not
be
able
to
próv
ido
the
Sof
twar
e on
an
econ
omle
bas
tsw
lthou
tsuc
h llm
itatio
ns,
10.
U.S
. GO
VCR
NM
ENT
RES
TRIC
TEO
RIG
HTS
LEG
END
This
Sof
twar
e an
d th
e do
cum
enta
tío n
are
pro
víde
d w
lth "
RES
TRIC
TED
RIG
HTS
", U
se,
dupl
krat
ion,
or
dlsd
csur
e by
the
U.S,
G
over
nmen
t is
sub
ject
to
rest
rictio
ns a
s se
t fo
rth
In
thls
EU
LA a
nd a
s pr
ovid
ed i
n DF
ARS
227.
7202
-l{a)
and
227.
72D
2-3(
a) (
1995
), D
FAR
S 2
52.2
27-7
013
(c)(
Í)(l¡)
(OC
T 1
9B8)
, FA
R 1
2.21
2(a)
(199
5},
FAR
52.
227-
19, o
r FA
R 5
2.22
7-14
, as
appl
lcab
le. M
anuf
actu
ren
Sen
sory
, Inc
., 19
91 R
usse
ll A
ve.,
San
ta d
ará
, CA
950
54.
11.
Con
sum
ar E
nd U
san
Onl
y (o
utsl
da o
f the
USA
)Th
e llm
ltatío
ns o
r ex
dusl
ons
of w
arra
ntie
s an
d H
abllit
y co
ntai
ned
In t
hls
EULA
do
not
affe
ct o
r pr
ejud
lce
the
stat
utor
yrlg
hts
of a
con
sum
er, I
.e,,
a p
erso
n ac
qulrl
ng g
oods
oth
erw
ise
than
in t
he c
ours
e of
a b
ustn
ess.
12.
Gen
eral
Pro
visi
ón*
Thls
EUU
A sh
all
be g
over
ned
by t
he f
ntem
al la
ws
of t
he S
tate
of
Cal
iforn
ia.
This
EUL
A co
ntal
ns t
he c
ompl
ete
agre
emen
tbe
twee
n th
e pa
rties
With
res
pect
to t
he s
ubje
ct m
atte
r he
reof
, an
d su
pers
edes
al|
prio
r or
con
tem
pera
neou
s ag
reem
ents
or u
nder
stan
ding
s, w
heth
er o
ral o
r w
ritte
n, A
H qu
estio
ns c
once
mln
g th
ls E
UW
sha
ll be
dire
cted
to:
San»rv
, In
c.,
1991
Rui
selt
Ave
., S
anta
Cla
ra,
CA
950
54.
Alte
n tío
n: G
ener
al C
ouns
el.
P/N
80
-02
40
-A©
2003
Sen
sory
In
c.
Qui
ck s
tart
Man
ual
Vo
lee D
lrec
t™ II
Sp
eech
Rec
og
nlt
ion K
lt
1. I
ntr
od
uct
lon
Thank
you f
or
purc
hasl
ng the
Vol
ee D
lrecc
™ I
I S
peec
h R
ecog
nltlo
n K
lt. W
e a
re s
ure
th
at
you
wlll
appre
date
how
eas
lly b
aslc
vol
ee r
eco
gnltl
on c
apab
llltle
s ca
n b
e a
dded
to v
our
elec
tron
lc p
roje
ct.
For
mor
e I
n-d
epth
deve
lopm
ent,
we
sugg
est
you
up
grad
e to
th
e
Vol
ee
Ext
rem
e"1
Toolk
lt, w
hic
h
offe
rs
addl
tlona
l sp
eech
tech
nolo
gles
and
a s
tan
d-a
lon
e m
icro
controlle
r.
Thl
s Q
uick
Set
up G
ulde
Is
Inte
nded
to p
rovl
de
a b
aste
re
fere
nce
for
the
cap
ablll
tles
of t
he V
olee
Dire
ct™
US
RK
, an
d w
lll h
elp
sta
rt y
ou o
n t
he w
ay t
o utll
lzln
g v
olee
act
ivatlo
n q
uick
ly a
nd e
aslly
, F
or m
ore
det
alle
dte
chnlc
al
Info
rmatio
n a
bo
ut
the
Vol
ee D
irect
™ I
I m
odul
e a
nd
Senso
ry's
aw
ard
wln
nln
g s
peec
h re
cogn
ltlon
tech
nolo
gle
s, p
leas
e vl
slt
ou
rwe
b s
ite a
t w
ww
.se
nso
rYln
c.co
m.
2. F
eatu
res
• E
dge-
Trlg
gere
d, C
ontln
uous
Lls
tenl
ng a
nd
Wo
rd-S
po
ttln
g s
peec
h re
cognltl
on te
chnolo
gle
s•
Mín
ima!
ext
em
al
com
pone
nts
Rec
ognl
zes
up to
15
wor
ds o
r ph
rase
s (b
roke
n In
to 1
, 2 o
r 3
set
s)O
ver
99%
reco
gnltl
on
acc
urac
y w
lth p
roper
desl
gn•
Phr
ase
reco
gnltl
on u
p to
2.5
sec
onds
• U
ser-
frie
ndly
spe
ech p
rom
ptln
gQ
uick
setu
p t
ime
3. C
on
ten
tsO
ne V
olee
Dire
ct™
II
Moth
erb
oard
One
Vol
ee D
irect
™ II
Mod
ule
One
Batte
ry C
lipT
hree
lO
Kre
sist
ors
One
470
ohm
resi
stor
Thr
ee R
ed L
ED
sO
ne Y
ello
w L
ED
One
Qulc
ksta
rt M
anua
l
4. A
bo
ut
Sp
eech
Rec
og
nít
ion
Vol
ee D
irect
™ I
I perf
orm
s sp
ea
ker-
de
pe
nd
en
t dls
crete
wo
rd r
eco
gnic
ión b
y co
mparlng a
patte
rn g
enera
ted In
real
tim
e w
ith p
revl
ousl
y tr
aln
ed
wo
rd t
em
pla
tes,
The p
attern
genera
ted b
y V
olee
Dire
ct™
II
Is b
ased
on
adig
ital
reco
nst
ruct
lon
of
the
vol
ee c
om
ma
nd
. E
ach
word
to
be
rec
ognl
zed
must
flrst
be
tra
lne
d,
Dur
lng
traln
lng,
Vol
ee D
irect
™ I
I co
nst
ruct
s a
tém
pla
te r
epre
sent
lng t
he I
ndiv
idual
spea
kere
s un
lque
sound p
att
em
for
each
spe
clflc
wo
rd o
r phra
ss t
o
be r
eco
gnlz
ed.
Tem
plat
es
are s
tore
d I
n n
on-v
ola
tlle
fla
sh m
em
ory
,D
urln
g r
eco
gnltl
on
a n
ew t
ém
pla
te I
s pr
oduc
ed a
nd c
om
pa
red
to t
he s
tore
d t
em
pla
tes
to d
ete
rmin
e W
hich
wo
rd w
as
spoke
n.
Vol
ee D
irect
™ I
I fe
atu
res
Inte
grat
ed s
peec
h pro
mptln
g f
or
both
tra
lnln
g a
nd
reco
gnltl
on
oper
atlo
ns,
allo
wln
g th
e d
evel
opm
enc
of
sophls
tlcate
d Inte
ract
ive
pro
duct
s w
lth m
lnlm
al p
rogra
mm
lng.
Vol
eeD
irect
™ II
perf
orm
s th
e fo
llow
lng o
pera
tlons
wh
en re
cogn
lzln
g a
wo
rd:
1.
The
aud
lo s
lgnal (
spok
en w
ord
or
phra
se)
Is e
xte
ma
lly a
mpllf
led
and
fllte
red
and
then
sup
plle
d to
the
anal
og Inputs
of t
he
Vol
ee D
irect
™ I
I, w
hich
conve
rts
the
ana
log
wa
vefo
rms
to d
igita
l sam
ple
s.2.
V
olee
D
irect
™ I
I an
alyz
es
the
sp
eech
sl
gnal
sam
ples
and
gen
erat
es
a t
ém
pla
te
of
Info
rmatio
nre
pres
entln
g s
lgnlfl
cant
spee
ch e
lem
ents
.3.
V
olee
Dire
ct™
II
Incr
ease
s or
decr
ease
s th
e g
aln
of
the
ext
em
al
am
pllf
ler
as
need
ed t
o m
aln
taln
slgn
al q
uallt
y.4.
T
he u
nkn
ow
n té
mp
late
Is c
om
pa
red
to e
ach
of t
he t
rain
ed
tem
pla
tes
to d
eter
min
e t
he o
ne t
ém
pla
teth
at
prov
ldes
the
bes
t m
atc
h.
5.
If t
he
bes
t m
atc
h té
mpla
te g
lves
a s
core
abo
ve a
pre
-defln
ed t
hre
shold
, V
olee
Dire
ct™
II
choo
ses
the
word
ass
ocla
ted
wlth
the
c té
mpl
ate.
If
no té
mp
late
pro
vlde
s a m
atc
h a
bove
thre
shold
, a s
pecl
al "
nom
atc
h"
valu
é ¡s
cho
sen.
© 2
003 S
enso
ry I
nc.
P/N
80
-Q2
40
-A
Vole
e D
irect
™ U
Sp
eech
jteco
gn
ltlo
n K
itQ
uic
kSta
rt M
anua
l
Ste
ps 1
-3 a
bove
are
rep
eate
d f
or e
ach
wor
d d
urin
g t
raln
lng.
Vol
ee D
Irect
™ 1
1 st
ores
the
av
erag
e of
tw
otr
aln
lng p
atte
rns
for
each
wo
rd t
o I
mpro
ve a
ccur
acy.
B
efor
e a n
ew t
ém
pla
te I
s st
ore
d, It
ls c
ompa
red
wlth
the
exl
stin
g t
ém
pla
les
In t
he s
et.
The
new
can
dída
te w
ord
wll!
not
be
acc
epte
d If
It !
s to
o s
imila
r to
an
exls
tlng
wor
d (
for
exa
mple
, "B
ill S
mlth
" and
MU
Í S
mlth
").
Vol
ee D
Irect
™ I
I,
llke
all
oth
er
spee
ch r
ecog
nltlo
n s
yste
ms,
¡s
nece
ssar
lly s
ubje
ct t
o t
wo
typ
es
of
err
ors
;re
ject
s (fallu
re to
rec
ognl
ze a
word
In th
e v
oca
bula
ry}
and
su
bst
ítu
tlon
s {c
onfu
sión
of t
wo v
oca
bula
ry w
ord
s,or
rec
ognl
tlon
of a
non
-voc
abu!
ary
wo
rd),
The
rela
tive
Irnport
ance
of
each
typ
e o
f err
ar
may
dep
end
on t
heap
pllc
atlo
n. V
olee
DIre
ct™
II
prov
ldes
sele
ctlv
lty l
eVel
s th
at
allo
w t
he
use
r to
optim
lze t
he
tra
de
off
be
twee
nth
ese
two
typ
es o
f re
cognltt
on e
rrors
. W
hen
the r
eco
gnltl
on s
ele
ctlv
lty l
evel
ls
set
to Its
hlg
hest
valu
é,
Vol
eeD
lrect
™
II
mln
lmlz
es
subst
ltutlo
n
erro
rs
but
may
prod
uce
m
ore
reje
ctlo
n
err
ors
. W
hen
the
traln
lng
sele
ctlv
lty l
evel
ls
set
to Its
hlg
hest
val
ué,
Vol
ee D
!rec
tTH I
I m
lnlm
lzes
both
subst
ltutlo
n a
nd reje
ctlo
n e
rrors
by r
eje
ctln
g w
ords
th
at
are
too
sim
ilar
soun
dlng
, pote
ntla
tly I
ncre
asln
g re
cog
nltl
on
acc
urac
y. T
hese
set
tings
are b
est
esta
blls
hed
by
exp
erlm
entln
g w
lth y
ou
row
n a
ppllc
atlo
n an
d e
nvl
ronrn
ent,
5. B
uitd
lng
a B
asic
Ap
plic
atio
nC
ON
ST
RU
CT
JON
TaV
e In
to c
on
sid
era
ron t
he f
lxtu
re o
ptlo
ns f
or
the
Vol
ee D
Irect
™ I
I m
oth
erb
oard
an
d/o
r m
odule
. Y
ou m
ay
mount
the m
oth
erb
oard
and m
odul
e t
ogeth
er,
or
deta
ch t
he
mod
ule
and
Inst
all
It b
y Its
elf,
Usl
ng t
he m
odul
eal
one
may
Inc
reas
e th
e a
ddltl
onal
par
ts r
equl
red
for
opera
tlon,
Oth
er f
acto
rs w
ill a
lso
Incl
ude
the
slz
e of
your
appl
lcat
lon,
and
how
com
pact
and tr
ansp
ort
able
It w
lll n
eed
to b
e.
* O
ne
pos
slbl
e m
etho
d o
f co
nst
ruct
lon l
s to
use
a s
ímil
pro
ject
box
, m
ountln
g t
he
spe
aker
, m
lcro
phon
e,push
butto
ns,
and
moth
erb
oard
an
d/o
r m
odul
e (
on s
tand
offs
) In
the
box
. F
or c
onne
ctlo
ns,
30 A
WG
wlre
-w
rap
wlr
e ca
n b
e
sold
ered
dlre
ctly
fr
om
th
e
top
(no
n-c
on
ne
cto
r si
de)
of
the
mod
ule
to
th
e
oth
er
com
pone
nts.
+
An a
ltérn
ate
meth
od
of
const
ruct
lon
Is
to u
se a
ple
ce o
f p
erf
ora
ted o
r pro
toty
pln
g b
oard
(a
pp
rox,
2"x
5")
,m
ount
lng
mal
e h
eader
strlp
s (0
.1"
cent
ers)
to
the
perf
boa
rd
to
acco
mm
odat
e th
e m
odule
, T
he
perf
boar
d c
an a
lso
be u
sed
to m
ount
the
push
butto
ns,
as
well
as a
ny o
ther
com
pone
nts
requlre
d b
y yo
ur
appl
lcat
lon.
1/
8"
mon
o ph
one
jack
s an
d p
lugs
are
use
ful
for
qulc
kly
conn
ectln
g an
d d
lsco
nnec
tlng
the
spea
ker,
mic
roph
one
and
pow
er fro
m t
he r
est
of
the c
lrcu
ltry.
PO
WE
RT
he
Vol
ee D
Irect
™ I
I m
odul
e (
the
small
boar
d t
hat
is p
lugg
ed I
nto t
he
moth
erb
oard
) is
des
lgne
d t
o r
un a
t3.
3V, T
wo
i.SV
batte
rles
In a
plá
stic
hold
er
or a
lab
supp
ly c
an b
e us
ed a
s a
pow
er s
ourc
e. A
pow
er s
wltc
h In
serle
s w
lth o
ne o
f th
e p
ower
le
ads
wlll
maxl
mlz
e b
attery
Ufe
by
allo
wln
g y
ou t
o po
wer
dow
n t
he m
odul
eW
hen
not
In u
se.
Inco
rpora
tlng
a p
rote
ctlo
n d
lode
In
ser
les
wlth
the
pow
er s
uppl
y w
lll a
vold
dam
age
to t
heci
rcuít If
batterles
are
Inse
rted w
lth t
he
wro
ng p
ola
rlty
.
The
Vol
ee D
Irect
™ II
moth
erb
oard
(th
e la
rge
boa
rd t
ha
t th
e m
odul
e p
tugs
In
to}
has
a 3
.3V
regula
tor
Inst
alle
don
It, s
o I
t ca
n b
e p
ower
ed b
y th
e In
clud
ed 9
V b
attery
clip
. R
efer
to
figure i
for
Inst
ruct
lons
on
sol
derln
g th
eIn
clud
ed 9
V b
attery
clip
to
the
Vol
ee D
Irect
™ II
mo
the
rbo
ard
,
DA
NG
ER
!: I
F Y
OU
UN
PL
UG
TH
E V
01C
E
DIR
EC
T™
II
MO
DU
LE
AN
D R
UN
IT I
ND
EP
EN
OE
NT
LY
FR
OM
TH
E M
OT
HE
RB
OA
RD
, D
O N
OT
AT
TE
MP
T T
O P
OW
ER
IT
AB
OV
E 3
.3V
OR
IT W
ILL
BE
DA
MA
GE
DI
P/N
80
-02
40
-A©
200
3 Se
nsor
y In
c.
Qui
cíc
Sta
rt M
anua
lV
ole
e D
Irect
™ II
Speech
Recogniti
on K
it
14.
SE
NS
OR
Y S
oft
wa
re E
nd U
ser
tíce
nse
Ag
ree
me
nt
1. D
efln
ftlo
m(a
) "S
enso
ry" m
eans
Sen
sory
, Inc
. an
d Its
sup
plie
rs a
nd ll
cens
ors,
If a
ny.
(b)
"Not
For
Res
ale
(NFR
) V
ersi
ón"
mea
ns a
ver
sión
of
the
Sof
twar
e, so
Hen
tifie
d, t
o be
use
d to
rev
iew
and
eva
lúat
eth
e S
oftw
are,
onl
y.(c
) "S
oftw
are"
mea
ns t
he s
oftw
are
prog
ram
sup
plle
d by
Sen
sory
her
ewlth
, w
hlch
may
als
o In
dude
doc
u m
enta
tlon,
asso
date
d m
edía
, pr
inte
d m
ater
lals
, ano
1 onl
ine
and
elec
tronl
c do
cum
enta
ron .
2.
Llca
ns*
This
EUL
A at
low
s yo
u to
:(a
) In
stal
l and
use
the
Sof
twar
e on
a s
ingl
e co
mpg
ter;
OR
Inst
all a
nd s
tore
the.
Sof
twar
e on
a s
tora
ge d
evic
e, s
udí a
sa
netw
ork
serv
er,
used
onl
y to
run
or
inst
all t
he S
oftw
are
on y
our
othe
r co
mpu
ters
ove
r an
Inta
mal
net
wor
k,pr
ovld
ed y
ou h
ave
a llc
ense
for
eac
h se
pára
te c
ompu
ter
on w
hích
the
Sof
twar
e ls
Ins
talle
d or
run
fro
m t
hest
orag
e de
vice
, A lic
ense
for
the
Sof
twar
e m
ay n
ot b
e sh
ared
or
used
con
curr
entty
on
diffe
renC
com
pute
rs.
(b)
Mak
e on
e co
py o
f th
e S
oftw
are
In m
achi
ne-r
eada
We
form
sol
ely
for
back
up p
urpo
ses,
Yau
mus
t re
prod
uce
on a
nysu
dí c
opy
all c
opyr
ight
not
lces
and
any
oth
er p
ropr
ieta
ry le
gend
s on
the
orig
inal
cop
y of
me
Sof
twar
e.
3.
Uce
nse
Re*
trie
tlon
»(a
) O
ther
tha
n as
set
for
th I
n S
ectta
n 2,
you
may
not
mak
e or
dis
tribu
te
copi
es o
f th
e S
oftw
are,
or
elec
troni
cally
trans
fer
the
Sof
twar
e fr
orn
one
com
pute
r to
anot
her
or o
ver a
net
wor
k.(b
) Y
ou m
ay
not
deco
mpi
le,
reve
rse
engí
neer
, dl
sass
embl
e,
or
othe
rwis
e re
duce
the
S
oftw
are
to
a hu
man
-pe
rcel
vabl
efor
m.
(c)
You
may
not
sel
l, re
nt,
léas
e, tr
ansf
er o
r su
tílce
nse
the
Sof
twar
e,(d
) Y
ou m
ay n
ot m
odify
the
Softw
are
or c
réat
e de
rivat
lve
wor
ks b
ased
upo
n th
e S
oftw
are,
(e)
You
may
not
exp
ort t
he S
oftw
are
¡nto
any
cou
ntry
pro
hlbl
ted
by th
e U
nite
d S
tate
s E
xpor
t Adm
lnís
tratlo
n A
rt a
ndth
e re
gula
tions
ther
e un
der
(f)
In t
tie e
vent
that
you
fail
to c
ompf
y w
lth t
his
EULA
, S
enso
ry m
ay t
erm
ínat
e tri
e llc
ense
and
you
mus
t de
stro
y al
lco
pies
of
the
Sof
twar
e.
4. U
pgra
des
If t
his
copy
of
the
Sof
twar
e is
an
upgr
ade
from
an
earli
er v
ersi
ón o
f th
e S
oftw
are,
it
Is p
rovl
ded
to y
ou o
n a
licen
seex
chan
ge b
asls
, Y
ou a
gree
by
your
Inst
alla
tton
and
use
of t
hls
copy
of
the
Sof
twar
e to
vol
unta
riry
term
ínat
e yo
ur e
arlie
rEU
LA a
nd th
at y
ou w
lll n
ot c
ontin
ué t
o us
e th
e ea
rlier
ver
sión
of t
he S
oftw
are
or tr
ansf
er It
to a
noth
er p
erso
n or
ent
ity,
5.
Ow
ners
hlp
The
fore
goln
g lic
ense
giv
es y
ou ll
mlte
d r
ight
s to
use
the
Sof
twar
e, S
enso
ry a
nd It
s su
pplie
rs r
etal
n a
ll rlg
ht,
title a
nd[n
tere
st,
Indu
dlng
all
copy
rfght
s, I
n an
d to
the
Sof
twar
e an
d al
l cop
ies
ther
eof,
All
right
s no
t sp
edflc
alty
gra
nted
In t
hls
EULA
, Inc
ludi
ng F
eder
al a
nd In
tern
atio
nal
Cop
yrig
hts,
are
rese
rved
by
Sen
sory
and
its
supp
liers
,
6.
Lim
ited
war
ran
ty a
nd c
flccl
ilmer
(a)
Um
ited
war
rant
y. S
enso
ry w
arra
nts
that
, fo
r a
perio
d of
nin
ety
(90)
day
s fr
om th
e da
te o
f de
liver
y (a
s ev
iden
ced
by a
cop
y of
you
r re
ceip
t); (1
) w
hen
used
wlth
a r
ecom
men
ded
hard
war
e co
nfig
ura
tlon,
the
softw
are
wlll
per
form
In s
ubst
anci
al c
onfo
rman
ce w
ith t
he d
oaim
enta
tian
supp
lied
wlth
the
sof
twar
e; a
nd (
U) t
hat
the
phys
lcal
med
iaon
whi
ch th
e so
ftwar
e Is
fum
lshe
d w
lll b
e fr
ee fr
om d
efec
ts In
mat
eria
ls a
nd w
orkm
ansh
'p u
nder
nor
mal
use
.(b
) N
o ot
her
war
rant
y, e
xcep
t as
set
for
th 'm
the
for
egoi
ng Ü
mlte
d w
arra
nty,
sen
sory
and
its
sup
plie
rs d
lscl
aim
all
othe
r w
arra
ntle
s, e
lttie
r ex
pres
e or
Im
plie
d, o
r ot
herw
ise
Indu
dlng
the
war
rant
ies
of m
erdi
anta
bllit
y an
d fit
ness
for
a pa
rticu
lar
purp
ose,
Als
o, m
ere
ís n
o w
arra
nty
of n
onln
fring
emen
t, tit
le o
r qu
iet
enjo
yrne
nt,
If ap
pllc
able
law
impt
les
any
war
rant
ies
wlth
res
pect
to t
he s
oftw
are,
all
such
war
rant
ies
are
llmite
d [n
dur
atto
n to
nin
ety
(90)
day
sfro
m c
he d
ate
of d
eliv
ery,
No
oral
or
writ
ten
Inf
orm
atio
n or
adv
lce
give
n fa
y se
nsor
y, I
ts d
eale
rs,
dist
ribut
ora,
agen
ts o
r em
ploy
ees
shsl
l cré
ate
a w
arra
nty
or In
any
way
incr
ease
the
scop
e of
thls
war
rant
y,(c
) S
ome
stat
es (
US
A on
ly)
do n
ot a
llow
tíie
exd
usto
n of
impl
led
war
rant
les,
so
the
abov
e ex
dusl
on m
ay n
ot a
pply
toyo
u. T
nls
war
rant
y gi
ves
you
spec
lfic
lega
l rig
hts
and
you
may
als
o ha
ve o
ther
lega
l rig
hts
that
var
y fr
om s
tate
tost
ate.
of th
e S
oftw
are
wím
oth
er m
an a
reco
mm
ende
d ha
rdw
are
conf
igur
atío
n.
© 2
003
Sen
sory
In
c.P
/N 8
0-0
24
0-A
21
Vo
lca
PIr
act™
H S
pee
ch R
eco
enlt
lon
K!t
Qui
ck S
tart
Man
ual
12,
Dís
clai
mer
sW
ARNI
NGTh
ls k
it Is
Inte
nded
for
use
by
cons
umer
e w
lth e
xper
íenc
e In
dec
tronl
c de
sign
. As
wlth
any
ete
ctro
nlc
klt,
cau
tion
shou
M b
eex
erds
ed d
urtn
g as
sem
bly,
and
all
cann
ectío
ns s
houl
d be
dou
ble-
chec
ked
that
they
are
cle
an,
safe
and
pro
perly
sol
dere
dbe
fare
app
fyln
g an
y po
wer
sou
rce.
IMP
OR
TÁIS
DIS
CU
AIM
ERTo
the
Mle
st e
xten
t pe
rmitt
ed b
y ac
cept
afal
e la
w,
Sen
sory
, In
c. e
xpre
ssly
dls
clai
ms
the
Impl
led
war
rant
y of
fltn
ess
for
apa
rticu
lar
purp
ose.
Cus
tom
er s
houl
d un
ders
tand
mat
Sen
sory
doe
s no
t m
ake
any
repr
esen
tatlc
n th
at p
rodu
cís
purd
iase
dw
lll s
uit
cust
omer
's p
art
purp
ose,
Cus
tom
er r
nust
ret
y on
cus
tom
er's
ovm
ski
ll or
judg
men
t ín
sel
ectln
g su
ltabl
e pr
oduc
ísfo
r C
usto
mer
. To
the
exte
nt w
arra
nty
Is a
ppllc
able
, suc
h w
arra
nty
shal
l be
lirni
ted
lo 9
0 da
ys fr
om th
e da
te o
f pur
chas
e.
13.
Vo
lee D
irect™
II
Speech
Reco
gnlti
on K
it L
imite
d W
arr
an
tyTh
e V
olca
Dlre
ct1"
II
[5 w
arra
nted
aga
inst
def
ects
and
wor
kman
ship
for
a p
erio
d of
90
daya
fro
m t
be d
ate
of p
rodu
ctpu
rcha
se. S
enso
ry, In
c. w
lll,
at It
s op
tion,
«Ith
er r
epal
r or
repl
ace
a pr
oduc
t tha
t pro
vea
to b
e de
fect
ive
elth
er u
pon
rece
fpt
or th
roug
h no
rmal
usa
ge, if
a S
enso
ry S
peec
h R
ecog
nlllo
n K
it pr
oduc
t ha
s be
corn
e ob
sote
te o
r Is
no
long
er In
pro
duct
lon
and
deem
ed Ir
repa
rabl
e, S
enso
ry w
lll,
at ¡
ts o
ptio
n, p
rovl
de a
n eq
ulva
lent
pro
duct
or
syst
em fo
r a
nom
inal
fee
.S
enso
ry,
Inc,
w
arra
nts
this
S
peec
h R
ecog
nitío
n K
it pr
oduc
t, w
hen
prop
erly
In
staB
ed
and
used
, w
ill
exec
ute
Itspr
ogra
mm
ed i
nstru
ctlo
ns,
How
ever
, S
enso
ry,
Inc.
doe
s na
t w
arra
nt t
hat
the
oper
atto
n of
the
Pro
duct
, Its
firm
war
e an
dso
ftwar
e w
lll b
e un
lnte
rrup
ted
or t
otal
ly e
rror
fre
e. T
he P
rodu
ct m
ust
be r
etur
ned
to S
enso
ry,
Inc.
for
war
rant
y se
rvke
witliin
the
war
rant
y pe
ríod
to th
e fo
llow
ing
addr
ess:
199
1 R
uuall
Ava
., S
anta
Cla
ra,
CA
95054. T
he B
uyer
wHI
pay
a|l
ship
ping
and
oth
er c
harle
s or
ass
essm
ents
for
the
retu
rn o
f the
Pro
duct
to S
enso
ry,
Inc.
Um
ltaM
on o
f War
ran
tyTh I mi
:
Um
itatio
n o
f U
abllf
tyS
enso
ry's
liab
llity
shal
l be
lim
lted
to t
he r
epai
r or
rep
lace
men
t of
defe
ctiv
e pr
oduc
ís ¡
n ac
cord
ance
with
the
Vol
ca o
frecí
1"
II S
p«ec
h R
ecog
nltto
n K
it U
mlte
d W
arra
nty.
Sen
sory
sha
ll no
t be
Hab
le f
or a
ny in
cide
ntal
, sp
edal
or
cons
eque
ntía
lda
mag
es f
or
brea
ch o
f an
y w
arra
nty,
ex
pres
sed
or
Impl
led,
di
rect
ly
or
indl
rect
ly
arhs
ing
out
of S
enso
ry's
sal
e of
mer
chap
dlse
, In
dudl
ng a
ny fa
ilure
to
dellv
er a
ny m
erch
andl
se,
or a
rísln
g ou
t of
cus
tom
er's
¡ns
talla
tíon
or u
se,
whe
ther
prop
er o
r im
prop
er,
of th
e pr
oduc
t, se
para
tery
or
in c
ombl
natio
n w
lth o
ther
equ
lpm
ent,
or fr
om a
ny o
ther
cau
se. P
rodu
cts
sold
by
Sen
sory
are
not
aut
horlz
ed fo
r us
e as
oití
cal c
ompo
nent
s In
Ufe
supp
ort
devi
ces
or s
yste
ms.
IMP
OR
TAN
T N
OTI
CE
SS
enso
ry r
eser
ves
the
rig
ht to
mak
e ch
ange
s to
or
to d
isco
ntin
ué a
ny p
rodu
ct o
r se
rvic
e id
entif
ica
In th
ls p
ublk
atkm
at a
nytim
e w
lmou
t no
tíce
in
orde
r to
im
prov
e de
slgn
and
sup
pty
the
best
pos
sibl
e pr
oduc
t. S
enso
ry
does
not
ass
ume
resp
onsl
blllt
y fo
r us
e of
any
drc
uitry
othe
r th
an d
rcul
try e
ntíre
ly e
mbo
dled
In
a S
enso
ry p
rodu
ct.
Info
rmat
ion
cont
alne
dhe
reln
Is p
rovi
ded
grat
ufto
usly
and
wrth
out l
iabl
llty
to a
ny u
ser.
Rea
sona
ble
effo
rts h
ave
been
mad
e [o
ver
ify t
he a
ccur
acy
of t
his
Info
rmat
ion
but
no g
uara
ntee
wha
tsoe
ver
Is g
tven
as
to t
he a
ccur
acy
or a
s to
its
app
llcaW
Hty
to
parti
cula
r us
es.
App
tlcat
ions
de
scrib
ed I
n th
is
data
sh
eet
are
for
Hlu
stra
tive
purp
oses
onl
y, a
nd S
enso
ry
mak
es
no w
arra
ntle
s or
repr
esen
tatto
ns t
hat
the
RS
C s
erle
s of
pro
ducí
s w
tll b
e su
ltabl
e fo
r su
ch a
ppllc
atío
ns.
In e
very
Ins
tanc
e, !
t m
ust
be t
here
spon
sibi
llty
of t
he u
ser
to d
eter
min
e th
e su
itabl
llty
of t
he p
rodu
cís
for
each
app
llcat
lan,
Sen
sory
pro
ducí
s ar
e no
tau
lhor
ized
for
use
as c
ritic
a! c
ompo
nent
s |n
ufe
sup
port
devt
ces
or s
yste
ms.
Sen
sory
con
veys
no
licen
se o
r tít
fe,
elth
erex
pres
sed
or Im
plie
d, u
nder
any
pat
ent,
copy
right
, or
mas
k w
ork
right
to
the
RS
C s
erle
s of
pro
ducí
s, a
nd S
enso
ry m
akes
bala
nce
betw
een
reco
gnltí
on a
nd s
ynth
esis
no
war
rant
ies
or r
epre
sent
atio
ns t
hat
the
RS
C s
erie
s of
pro
ducí
s ar
e fre
e fro
mpa
tent
, co
pyrig
ht,
or m
ask
wor
k rig
ht ¡
nfrin
gem
ent,
unle
ss
othe
rwis
e sp
edfie
d,
Not
hlng
con
taln
ed
here
ln
shal
l be
cons
trued
as
a re
com
men
datio
n to
use
any
pro
duct
In v
lola
tion
of
exls
ting
pate
nts
or o
ther
rig
hts
of t
hlrd
par
tles,
The
sal
eof
any
Sen
sory
pro
duct
|s s
ubje
ct to
all
Sen
sory
Ter
ms
and
Con
dltio
ns o
f Sal
es a
nd S
ales
Pol
ldes
,
20P
/N S
O-0
24
0-A
© 2
003
Sen
sory
Inc.
Qui
ck S
tart
Man
ual
Vo
lee D
trect"M
:i S
pee
ch R
eco
gn
ltío
n K
tt
Fig
ure
1 -
insta
llln
g T
he
Inclu
dad
Ba
tte
ry C
lip
VD
II
Ho
ther
bo
ard
(Bo
tto
m
Vie
w)
Batt
ery
C
lip
In a
ddltl
on
to
the I
nclu
ded
batte
ry c
lip,
the
use
r ha
s th
e o
ptfo
n o
f us
tng a
sta
ndard
9V
wall
adapte
r (n
ot
Induded).
The
wa
ll adapte
r ca
n b
e p
lugg
ed Into
J7
dlre
ctly
ellm
tnatln
g t
he
nee
d fo
r us
ing
the faatte
ry c
lip.
OU
TP
UT
S
* C
onsl
der
wh
at
typ
es
of
load
s yo
u a
re g
olng
to b
e d
rlvln
g w
lth t
he o
utp
uts
. M
ost
type
s of
load
s (L
ED
s,m
oto
rs,
rela
ys,
etc
.) w
lll r
equlre
som
e ty
pe o
f outp
ut
drlve
r cl
rcultr
y. A
dis
cuss
lon
of t
hese
clrc
ults
Is
beyo
nd t
he s
cope
of th
ls g
utde
, bu
t a
gre
at
plac
e to
sta
rt lo
okl
ng
Is I
n t
he d
atab
ooks
, appllc
atlo
n n
otes
,and o
n t
he
web
pag
es o
f m
ajo
r se
mic
onduct
or
manufa
cture
rs.
For
more
Info
rmatio
n,
refe
r to
the
DC
Cha
ract
erís
tlcs
In S
ectio
n 6
,
+
Kee
p In
mln
d t
hat
tha
t th
e o
utp
uts
onl
y to
gg
le h
!gh
for
1 s
econ
d. I
f yo
u w
an
t th
em
to
sta
y ht
gh,
you c
an
add
a la
tchln
g o
utp
ut
drlv
er.
The
outp
uts
als
o to
ggle
as
part
of
the p
ow
er
up I
nltl
allz
atto
n s
eque
nce,
so
bear
]n m
lnd
how
that
may
affe
ct y
our
appllc
atlo
n.
* B
ecau
se V
olee
Dire
ct™
Jl
can
rec
ognl
ze 15
wor
ds I
n s
tan
d-a
lon
e m
ode,
but
has
onl
y 8 o
utp
uts
, so
me
deco
dlng
clrc
ultr
y Is
requlre
d if
the a
ppllc
atlo
n requlre
s m
ore
than
8 w
ord
s to
be
reco
gnS
zed.
The form
at
of t
he o
utp
utted
wo
rds
Is d
lscu
ssed
under
"Rec
ognl
zlng
Word
s".
SY
ST
EM
DE
SIG
N+
If
the m
odul
e I
s us
ed I
n a
sys
tem
wlth
oth
er
dig
ital
dock
s (s
wltc
hln
g p
ower
sup
plle
s, L
CD
drl
verj
etc
,)ta
ke s
pecl
al c
are
to p
reve
nt
these
sig
náis
fro
m b
elng
cou
pled
Int
o t
he
aud
lo d
rcultr
y o
f Vol
ee D
irect
™ I
I.
+
Wlth
pro
per
pro
duct
const
ruct
lon,
Vol
ee D
irect
"" II
m
eets
th
e C
E r
equlre
rnents
fo
r el
ectr
omag
netlc
radla
tlon
and Im
munlty
. T
o m
lnlm
lze
radla
ted
em
lssl
ons,
speake
r w
lres
should
be
less
than 3
" lo
ng.
Inaddltl
on,
the
spe
aker
cab
le a
nd p
ower
cab
le s
houl
d b
e o
rlente
d o
n o
ppos
lte s
ldes
of
the m
odul
e.
MIC
RO
PH
ON
E C
ON
SID
ER
AT
ION
SF
or
most
ap
pllc
atío
ns,
an I
nexp
ensl
ve
om
nl-d
lrect
lonal
ele
ctre
t ca
paci
tor
mlc
roph
one w
lth
a
mín
imum
sensl
tlvlty
af
-60
dB
Is
ad
eq
ua
te.
In s
ome
appl
lcat
lons
, a d
lrect
lonal
mlc
roph
one m
lght
be m
ore
sulta
ble
If
the
slgn
al c
omes
fro
m a
dlff
ere
nt
dlre
ctlo
n t
ha
n t
he
audl
o no
lse.
Sln
ce dlre
ctlo
nal
mlc
roph
ones
ha
ve a
freq
uenc
y re
spon
so t
haC
dep
ends
on thelr
dts
tanc
e fr
om
the
sou
nd s
ourc
e, s
uch m
lcro
phon
es s
houl
d b
e u
sed
wlth
cautio
n.
For
bes
t perf
orm
ance
, sp
eech
reco
gnltí
on
pro
duct
s sh
ould
be
use
d In
a q
ulet
envl
ronm
ent
wlth
the
spe
aker
's m
outh
In
ció
se p
roxl
mlty
to
the
mlc
roph
one.
© 2
003
Sen
sory
Inc
.P
/N 8
0-0
24
0-A
Vol
ee D
Irec
t1"
II S
pecc
h R
eco
gn
llio
n í
íitQ
ulck
Sta
rt M
anua
l
Import
ant
mec
ha n
i ca
l Iss
ues
pert
ain
lng
to m
lcro
phone
ass
em
bly
:
# FI
RS
T: In
the
pro
duct
, th
e m
lcro
phon
e ei
emen
t sh
ould
be
posl
tlone
d as
ció
se t
o th
e m
ount
lng
surf
ace
aspo
sslb
le a
nd s
houl
d be
fully
sea
ted
In a
ny h
ousl
ng.
The
re m
ust
be N
O a
lrspa
ce b
etw
een
the
mlc
roph
one
elem
enc
and
the
hous
lng,
as
thls
can
lead
to a
cous
tic r
eson
ance
, w
htch
can
redu
ce re
cogn
ltlon
acc
urac
y.
* S
EC
ON
D;
The
áre
a In
fro
nt
of t
he m
lcro
phon
e ei
emen
t m
ust
be k
ept
clea
r of
obs
truc
tlons
to
avol
dIn
terfe
renc
e w
lth
reco
gnltl
on.
In
gene
ral,
the
dlam
eter
of
the
ho
le
!n t
he
hous
lng
In f
ront
of
th
em
lcro
phon
e sh
ould
be
aC le
ast
5 m
m.
Any
nec
essa
ry p
lást
ic s
urfa
ce In
fro
nt o
f th
e m
lcro
phon
e sh
ould
be
very
thln
, no
mor
e th
an 0
,7 m
m If
pos
slbl
e,
+ TH
IRD
: T
he m
lcro
phon
e sh
ould
be
acou
stlc
ally
Iso
late
d fr
om t
he
hous
lng
In s
ame
way
. Th
ls c
an b
eac
com
plis
hed
by s
urro
undl
ng t
he m
lcro
phon
e ei
emen
t w
lth a
spo
ngy
mat
eria
l su
ch a
s ru
bber
or
foam
,M
ount
ing I
t w
!th
a p
llabl
e, n
on-h
arde
nlng
adh
esiv
a Is
ano
ther
pos
slbl
llty.
The
pur
pose
Is
to p
reve
ntau
dito
ry n
olse
s pr
oduc
ed b
y ha
ndlln
g or
Jar
rlng
the
prod
uct
from
bel
ng "
plck
ed U
p" b
y th
e m
lcro
phon
e,S
uch
extr
aneo
us n
olse
s ca
n re
duce
reco
gnltl
on a
ccur
acy.
6. M
oth
erb
oar
d a
nd
Mo
du
le p
inou
t an
d C
har
acte
rlst
ics
Fig
ure
2 -
Vol
ee D
lrect
™ II
Mod
ule
Tab
le 1
- V
olee
Dlr
eet™
II
Mod
ule P
in A
sslg
nm
ents
i ro
und
eonr
ettfa
n
^^c(
0|H
lo^e
InpJt
Con
nect
lon
4«
Use
d - U i
ví
Ooe
n
g ou
tput
[udbuflc
eaj
;roun
d e
onre
ctio
n
r co
nnei
tlon
(ne
fl«tlv
e)
r am
nect
uxi (p
o*Iily
e)
<o( U
ied -
Lea
ve O
pen
S«
Use
d -
Leitf
Ope
n
íot U
icd-L
e««
Ope
n
Soft
Rcs
ít oí
VD
K*
fflre
tr II
(Act
ive
to
1.3
Vol
t (+
) po
wer
wpp
ly e
onn«
«tan
^ot
Use
d -
Uavt
Opc
n
P/N
8D
-024
0-A
© 2
003
Sen
sory
Inc
.
Qul
ck S
tart
Man
ual
Vo
lee
Plr
ect™
II S
peec
h R
ecog
nltlo
n K
lt
© 2
003
Sen
sory
Inc
.P
/N 8
0-02
4D-A
(*'
Vol
ee D
irect
1" II
Spe
ech
Rec
og
nlti
on
Ktt
Qut
ck S
tart
Man
ual
Qu'
ck S
tart
Man
ual
11. S
chem
atic
s fo
r V
oic
e D
irec
t ™
II
Mod
ule
and
Mo
ther
bo
ard
(An
elec
tron
lc v
ersi
ón o
f ch
is m
anua
l wltb
MI
slze
sch
emat
ics
can
be d
ownl
oade
d fro
mht
tD://
wví
w.s
enso
tvIn
c.co
m/h
tmlj'
suD
Dar
t/doc
umen
tatlo
n.ht
mn
Vol
ee D
irect
™ II
Spe
ech
Reco
gnlti
on K
lt
17 18 19 10 31
22
33 M 35
26 37
38 39 30
31
32 33 34
ouru
po.o
j
DU
TK
P0.
1)
cura
ra.*)
tXJP
(PO
J)
OU
TS
IP0.
4) ' '
r*ut(po.7
)
•TR
AIN
tPl.O
)
-BE
CO
G[P
1.1)
-TR
1G T
RA
INIM
.JJ
DU
T61P
U3J
3UT
7(P
1.4)
OU
TS
tPl.5
)
MO
OE
l(Pl.a
)
MQ
DE
ItPl.7
)
5ND
GN
D
Oul
Bui l
of 9
l*t
tlv«
nig
n)
Out
nut
3 0
' 10
lA
clty
í 1*
8»)
cwip
ut
3 o
' L
i [fet\
msn
j
Out
put4
ori3
[Act
lver
fgh)
Outp
ul S
o' U
l*c
t*e
«91)
NM
UM
Ú '
le
tvt
Ope
n
NM
UM
d - U
aw
Op«
n
Oul
put A
ctiv
e H
lflH
WH
«n V
oia
Olratt"
11 H
Uite
nbfl F
o( U
«er
Spe
«cn
Sta
rt S
O T
Min
Cns/
Confif
lure
TfiI
nlP
í/Reco
flnllion
Ser
vtíB
vüy
S«tM
lQW
)
St*
t R
ttofli
rtio
n /
Con
figur
e H
icro
pnon
e S
»fl»
'lMty
[ÍM
oe(£
w¡
Sla
rt T
riw
er
Wor
d T
iiWns (S
O,
HO
-, S
WS
moO
tí o
nty
) /
Con
figur
a C
L P
er fo
rma
nte
(M
R b
etow
)O
utw
tfi
or H
[A
ctlv
í W
íti)
Oulw
l? o
r 15
(A
elh
* W
B")
Ouip
ui B
(A
ítfv
e íilg
rí)
•Icxt
e S
ele
aio
n P
in 1
Hod
« S
tiect
íon
Pin
3
G r
ound
con
nect
ton
G r
ound
cun
nect
tefi
O 0 0 o o • - o 1 1 1 o o o I I I I
Figu
re 3
- V
olee
Dir
ect™
II
Mot
herf
aoar
d
54
SS
(R»w
t)
(noc
iu*d
)
O
O O
SI
S2
S3
(Tniln
) (R
óeo
s)
(O.
Trai
n)
Vok»
DV
ect"
II M
odute
l&O
.BfW
jU
* I
hlE
nlIrt
c)^
[—
I
18P
/N 8
0-0
24
0-A
© 2
003
Sen
sory
Inc
.©
200
3 Se
nsor
y In
c-P
/N 8
0-Q
240-
A
Vole
e D
lrec
t™ I
I S
pee
ch R
eco
gn
ltlo
n K
ltQ
uick
sta
rt M
anua
lQ
uick
Sta
rt M
anua
lV
ole
e D
lrec
t™ n
Sp
eech
Ree
og
nlt
ion
Table
1 ~
Vo
lca D
lrect
™ II
Ho
therb
oard
Pin
Ass
lgnm
ents
Jl Jl n Ji ji Ji Jt jt ji Ji Ji Jl ji ji ji Ji Ji ji Ji Ji ¡s JS JS JS Jfi
J6 J6 je ja J6 J6 J6 Jo ja
DI
01
0] w os os 07 08 09 10 11 12 13 14 1S 16 17 IB 19 20 01
02
03 04 01
02 03 04 05 06 07 06 09 10
fJ.J
V
f3,3
V
OU
TUP
O.O
)
TM
INyU
JJ
OU
T3(
PO
.IJ
AE
CO
G(P
l.I)
QU
TJ(
PO
.J)
7RIG
TR
AJN
(P1.
2)
OU
HtP
O.3
)
OU
T6(
P1.
3)
OU
T5(
P0.
4)
DU
T71
P1.
4)
OU
TB
[Pl,5
)
•100U
IF1.6
)
rALK
(P0.
7)
>iO
Da[P
l.7)
GhD
GN
D
5AC
OU
T
;- 3ND
MO
t3.3
V
XJT
KP
O.O
)
RE
SÍT
3Ü
TU
M.O
)
f3.3
V
3NO
3ND
.3 V
o>t i+
j po
w«f
«jp
o'y
corm
«e«n
,3 V
olt
{+]
pow
er «
uppl
Y tonníe
tton
Oulp
ul l
of 9
(A
cttv
* m
aní
lart
50
Tra
tnin
s f
Confíate
T
ríln
lng/R
eeoflr
utto
n S
ensl
Uvf
tyK
WÍW
lew
)
Qutp
ui i
or 10
(A
ctiv
e W
on)
St»
rt R
ítognU
tof; / c
ondouie
Hfc
ropn
on» S
*ns'U
vliy l««
OC
kM]
Oulp
ui 3
or
U (
MU
ve
tilgti)
Sta
ttT
flga«f
Wort
Tf»
W<n
g (S
O,
MC
L, S
WS m
odti o
nly
) /
Con
Tou
ic C
L P
erfo
rman
ce (
ttf
belo
xlO
utpu
t 4
of 1!
[Act
ive
hfg
n)
Out
put
6 o
r 14
(A
ctN
e n
lgn)
Oulp
ut
5 o
f 13
(A
ítiv
e ti
IctO
ouip
ut
7 o
r 15
(A
ctrv
í tif
gn)
NoH
Jie
d-L
e»»eO
jen
Ou
tpu
t 8
(A
ctiv
e h
lon)
Mol
Uie
d -
Les
vc O
pen
hVM
e S
ílíitt
oo
Pin 1
Dutp
ut
Act
ive H
lgh
Wde
n V
tfce D
lrect
" 11
Is
Uile
nhfl F
or U
ier
SP
íecn
1od«
S*!
(rtton
Pin
2
G ro
und c
om
edió
n
Gnju
ml co
nnec
tion
Uig
tog o
utp
ut tu
ttDul
fere
dJ
tot u«tf -
Lea
.e O
pen
«il
Ute
d -
Lea
ve O
pen
*>(
UiM
- U
* v
e O
p*n
imund
con
necl
tod
Sro
und
cortt
ieet
ton
J.3
Voii
(•*•
) po
w«r
tjp
píy
oiiir«
c«M
iulp
ul
1 o
r 9 (A
ttta
hio
li)
áofl
Rent
oí V
tfc«
Dire
ct™
11 (
Act
ive
tow
)
Wt
Utc
ú -
Lelv
e O
pen
>ut
put
1 o
r 9
(A
ctiv
e h
lgti)
U
Vo
lt {-
f } p
oner
wptfy c
onre
ctto
n
íround
coin
ect
ion
iiound
cofi«
Ucfi
1 I O 1 o I o 1 0 o o o • o • I 0 1 I 1 o • • • 1 I ] o 1 • o I I I
9. E
rasi
ng t
he
Tem
pla
tes
Whe
n b
oth
th
e -T
RA
IN a
nd
-RE
CO
G p
in a
re p
ulle
d to
GN
D fo
r at
lea
st l
OO
mS
, V
olee
DIre
ct™
II w
lll e
rase
all
tral
ned
tem
ple
tes,
Vol
ee D
Irec
t™ n
w
lll s
ay '
'Mem
ory
era
sed"
, an
d t
hen
exl
t th
e er
ase
mo
de.
In
div
idu
alw
ords
or
sets
can
not
be e
rase
d se
par
atel
y,
10.
Tlps
fo
r O
pti
mal
Per
form
ance
Suc
cess
ful
reco
gnltl
on b
egln
s w
lth t
he
care
ful se
lect
lon
of
word
s fo
r ea
ch r
eco
gnlti
on
se
t. S
ever
al f
act
ors
contr
lbute
to s
ele
ctln
g a
n o
ptlm
al
reco
gnltl
on
set
. P
robl
emat
lc r
eco
gnltl
on
set
s ca
n o
fte
n be
corr
ect
ed
by
repla
clng
one o
r m
ore
wor
ds w
lth a
syn
onym
, or
appro
xlm
ate
syn
onym
(se
e e
xam
ples
, be
tow
), w
lthout
requlrl
ng
any
othe
r ch
ange
s, T
he s
ma
llert
he
set
, th
e h
lghe
r th
e r
ecog
nltlo
n r
ate
Thc
uptim
al
s<-t
consis
ls o
f:
Avitid
sets
lik
e:
Aim
fot
st-t
s lih
(?:
Dls
slm
llar
soun
dlng
wor
ds
Var
ylng
num
bers
of s
ylla
bles
hat/ca
t/ra
tho
me
ph
on
e/o
fflc
e p
hone
ora
nge/a
pple
/cherr
y
hat/k
ltten/m
ouse
ho
me
/off
lce
ora
nge/w
ate
rmelo
n/ g
rap
e
Kay
co
nsid
era
tlo
ns f
or
succ
ess
ful v
oic
e re
cord
lng:
• T
he
equ
lpm
ent
use
d to
tra
ln t
he
vol
ee r
ecor
dlng
s sh
ould
ma
tch t
he e
qulp
ment
used
dur
ing r
eco
gnltl
on.
Dlff
eren
ces
In m
lcro
phone,
mlc
roph
one h
ousi
ng,
etc
. w
lll a
dver
sely
aff
ect
reco
gnltl
on,
• T
he
condltl
ons
and
env
ironm
ent
In w
hich
tíie
vol
ee r
ecor
dlng
s are
made s
houl
d r
efie
ct t
he
con
dltío
ns a
nd
envl
ronm
ent In
whi
ch the
end
pro
duct
wlll
be
use
d,
»)
Dls
tance
, T
he d
ista
nce
of
the
míc
raph
one
from
the
spe
aker
's m
outh
must
be th
e s
am
e du
ring
reco
rdln
g a
nd d
urin
g e
nd-p
roduct
use
. F
or e
xam
ple,
a d
olí
Is t
yplc
ally
hel
d w
lthln
arm
's l
ength
,so
the
vol
ee re
cord
lng
mlc
roph
one s
hould
be
hel
d acc
ord
lngly
.b)
N
atu
ral
Vole
es.
S
ubje
cts
shou
ld s
peak
In
a n
orm
al
vole
e a
nd b
e d
lsco
urag
ed f
rom
so
undí
ngun
usua
l by
Im
ltatln
g
a f
ore
lgn
ac
cent
or
us
lng
an
y unnatu
ral
Into
natto
n.
The
y sh
ould
be
pro
mpte
d b
y m
eans
of
som
e n
on-V
erba
l so
urce
(plc
ture
s or
fla
shca
rds,
for
exa
mple
), s
o as
not
to u
ncon
sclo
usly
mlm
lc t
he
vole
e o
f th
e p
erso
n d
olng
the p
rom
ptln
g.
c)
Phys
lcal
Sta
tes.
P
hysl
cal s
tate
s sh
ould
be
cons
lder
ed.
For
exa
mp
le, t
o co
llect
vol
ee r
eco
rdln
gs
to a
ctív
ate
an
exe
rcis
e m
achi
ne, It
wou
ld b
e s
tron
gly
reco
mm
ended to
reco
rd p
eopl
e w
ho s
ound
out
of
bre
ath
.tí)
E
motíonal
Sta
tes.
E
mot
lona
l st
ate
s sh
ould
be
con
slde
red.
W
lll t
he
end
use
rs be r
ela
tlvely
qule
t and
ca
lm (
say,
for
an
off
ice
prod
uct)
or
loud
and
exc
lted
(say
, fo
r a
play
grou
nd t
oy)
?e)
E
nvlronm
ent
/ B
ack
gro
und N
ols
e.
Envl
ronm
enta
l no
lse
mus
t be
con
side
rad.
F
or e
xam
ple
, apr
oduc
t In
tend
ed f
or u
se Ins
lde
a r
novl
ng v
ehlc
le w
ould
beneflt
fro
m s
ampl
lngs
made
Insl
de a
car
wlth
the
m
oto
r ru
nnln
g.
Nev
erth
eles
s, th
e re
cord
lngs
mus
t be
mad
e I
n a
rea
sona
bly
qule
ten
vlro
nmen
t. T
he
spe
ech
slgn
al m
ust
be p
rom
lnent
rela
tiva
to
faack
gro
und
nol
se a
nd
there
shou
ld n
ot b
e a
ny a
bru
pt, l
oud
nol
ses.
Vole
e r
ecor
dlng
s sh
ould
not
be m
ad
e I
n a
sou
ndpr
oof
room
. T
hese
roo
ms
lend
an u
nnatu
ral
back
grou
nd s
llenc
e t
o th
e r
ecor
dlng
s,
whic
h d
oes
not
refie
ct t
he r
eal-w
orld e
nvl
ronm
ent In
whi
ch t
he e
nd p
rodu
ct w
lll b
e u
sed.
P/N
80-0
240-A
© 2
003
Sen
sory
In
c.©
2003
Sen
sory
Inc-
P/N
80-0
240-A
17
Qul
ck S
tart
Man
ual
SIN
GL
E-T
RIG
GE
RW
OR
D-S
PO
TT
ING
(S
WS
) M
OD
EW
hen
conf
lgur
ed f
or
SI n
gle-
Trlg
ger
Word
-Spottln
g m
ode,
the
Vol
ee D
lrect
™ U
w|||
, up
on p
ower
-Up
or
rese
t,ch
eck
to s
ee
!f a
ny w
ords
hav
e b
een t
raln
ed.
If s
o, th
en
Vol
ee D
lrect
™ II
wlll
Imm
edla
teiy
sta
rt llst
enln
g (
lnw
ord
-spottl
ng
mod
e) f
or
the
trlg
ger
word
. If
no
wo
rds
ha
ve b
een t
raln
ed,
then t
he
Voi
ce D
lrect
™ I
I w
lll w
a|t
for
the
use
r to
tra
ln o
ne o
r m
ore
wo
rds.
Aft
er
traln
ing,
the
-R
EC
OG
pin
can b
e b
rought
low
to i
nlti
ate
Wo
rd-
Spo
tting
reco
gnltl
on,
Jt Is
Im
port
ant
to n
ote
that
the
mod
ule
Is
only
llst
enln
g w
hen t
he T
Al-K
LE
D Is
llt.
Use
the
LE
D a
s an
Indlc
ata
rof
w
hen
you ca
n s
peak
the trlg
ger
and c
omm
and
wo
rds,
es
pecl
ally
whe
n f
irst
usl
ng t
he
module
, A
fte
rsu
cces
sful
reco
gnltl
on o
f th
e t
rigger
word
, th
ere
Is
a 3
sec
ond
wfn
dow
du
rlng
whl
ch V
olee
Dlre
ct™
II
lslls
tenln
g f
or
a c
om
ma
nd
wo
rd (
If a
ny
are
tra
ined).
If
no
co
mm
an
d w
ord
s are
tra
lned,
then
a s
ucce
ssfu
lre
cognltl
on
of
the t
rlgger
wor
d w
lll c
ause
the o
utp
uts
to
beh
ave
as
If t
he f
irst
com
man
d w
ord
had
bee
nre
cogn
lzed
(O
UT1
wo
uld
toggle
hlg
h).
Thl
s fe
atu
re l
s us
efut
If
only
a s
ingl
e t
rlgger
Wor
d ls
requlre
d.
Not
eth
at
Vol
ee D
lrect
™ I
I do
es n
ot
need
to
wa
lt th
e full
3 s
econ
ds I
f It
hea
rs y
our
com
ma
nd
wo
rd o
nce
It d
ete
cts
the
slle
nce a
t th
e e
nd
of y
our
uttera
nce
, re
cogn
ltlon
pro
cess
lng
wlll
beg
ln Im
media
tely
,
Whe
n a
tral
ned
seq
uenc
e of
wo
rds
(trlgger
wo
rdP
in(s
) w
lll p
ulse
hlg
h f
or
1 s
eco
nd:
com
man
d w
ord
) ls
reco
gnlz
ed,
the
ap
pro
prl
ate
Outp
ut
Recognitio
n W
ord
O
J
I i)>
." '
0."
" -;
C
U'
-I
OJ'
> (i
.'"^
íl.r
.
.'-il
.-!
Tri8
g«r +
Com
m«n
d W
ort o
j(o
rTrl
flse
r-t
Mo
Com
man
dW
ord»
Tra
lned)
Trt
go«r
4- C
omm
and
Wor
t) 0
2
Trl
gg
cf -
f co
mm
and
Wor
d o
s
Trlflf
l«r
4-C
om
trw
nd
Word
04
Trtflg
«r
4- C
omm
and
Word
05
trlg
gar
4-C
omm
and
Wor
d 0
6
Tf iggtr
4- C
omm
and W
ord
07
Trlg
gvr
4- C
omm
and W
ottl
OS
TrlB
Ber
4- C
ornm
and W
ord
09
Trlflg
«r4
-Com
m«nd
Wor
d 1
0
Tra
gar
-f C
omm
and
Wor
d lí
Trlg
oer
4- C
Om
man
d W
ord
12
Trlflo
er +
Com
man
d W
ord
13
Trlíg
er +
Com
man
d W
ord 1
4
Trt
agtr
4- C
omm
and W
ord
16
A A
A A
A A
A A
A A
A A
A A
A A A A A A A A
t*:
"fl'f
ndfa
tes
that
tho
out
puts
ara
"A
ctiv
e-hl
yh~ P
/N S
O-0
24
0-A
© 2
003
Sen
sory
Inc
.
Qui
ck S
tart
Man
ual
Vo
lee
Dir
ect"
" U
Sp
eech
Rec
og
nít
lon
Klt
Fig
ure
4 -
Bas
ic A
pp
licat
ion S
chem
atlc
, ^
y//
7AIK
(P0.
7) I3
~J
P
j ""
i
YaL
OW
LEO
oim
101
ni I
*
^J*^
^uun
(T
O-ü
]L__
j>
Vi
RE
D L
ED
ntir-
rm
ni
^
WU
UM
(ru
.ljl
¿r
W1
REO
LE
O
RED
LED
<
' OJ
T1DK
AL
*É
(3«
tafil
a 3
) '
' O
ofim
s '
' O
oíw
ra
'
i es
MO
tai
'|
(B« t
abl* 4
) <
, 1Q
K '
-REC
OO (P
l.l] f~
^>
1
^V
^
!
i 10
K
'
-TR
IO T
RAI
N {P
1.2
)CH
>
• ^/V
*
•1Q
K
'
> 300
MO
DE
SE
LE
CT
IOH
The
re a
re 4
maln
opera
ting
mod
es f
or
the
Vol
ee D
lrect
™ II
mod
ule t
hat
can b
e s
ele
cted
dependln
g o
n h
ow
vole
e re
cogn
ltlon
w
lll I
nte
ract
wlth
your
appllc
atlo
n.
The
se a
re
Edg
e-T
rlgge
red
Sin
gle
Rec
ognl
tlon
(ES
R)
mode,
Sln
gle
-Trlg
ger
Con
tlnuo
us U
sten
ing
(5
CL)
mod
e, M
uitl
-Trig
ger
Con
tlnuo
us U
sten
ing
(M
CL)
mod
e, a
ndS
I ngle
-Trlg
ger
Wo
rd-S
po
ttin
g (
SW
S)
mode.
The
MO
DE
1 an
d M
OD
E2
plns
are
use
d to
sel
ect
the
desi
red
oper
atin
g
mod
e.
The
ope
ratin
g
mod
e
¡s s
et
when t
he
Vol
ee D
lrect
™ I
I ls
fir
st
pow
ered
up
(o
r re
set)
acco
rdln
g to
th
e fo
llow
lng
tab
te;
Tib
ie 3
- V
oic
e D
irec
f™ I
IM
ude
Cu n
f¡gura
tion
pin
Con
tigo
ral i
onO
per.
-itm
q M
ode
oÉ
l op
en d
reult
NO
DE
2 op
en d
rcult
hOO
Ei
pirtl
ed lo
wM
OO
EJ
open
drc
ult
Edg
e-trl
gger
ed S
ingl
e R
ecog
nltlo
n IE
SR
) mod
e
{Sin
gle-
Tríg
ger
Con
tínuo
us U
sten
ing
(S
CL)
mod
e
en d
rcU
tM
OD
E2
pulle
d lo
w
HO
DEl pu
lled
low
MO
DE
2 pu
lleü
iow
¡MuW
-Trlg
ger C
ontln
uous
Ust
enin
g (
MC
L) m
ode
]Sln
gle-
Tí1
gger
Won
í-Spo
ttlng
(SW
S)
mod
e
Ope
ratin
g In
stnJ
ctlo
ns c
an b
e fo
und ln
sec
tlons
-i,
5 a
nd 6
of th
ls m
anual.
TR
AIN
ING
AN
D R
EC
OG
NIT
ION
SE
LE
CT
IVIT
YT
he -
TR
AIN
, -T
RIS
TR
AIN
and
-R
EC
OG
pln
s co
ntr
ol
the
sele
ctlv
lty a
nd
sensl
tlvlty
of
the
Vol
ee D
lrect
™
II,T
he c
onfig
ura
ron
par
arne
ters
are
set
when t
he
Vol
ee D
lrect
™ II
ls f
lrst
po
we
red u
p (
or
rese
t) a
ccor
dlng
to
the
follo
win
g t
able
:
© 2
003
Sen
sory
Inc.
P/N
80-
02^
0-A
Vol
co P
irect
™ II
Spe
ech R
eco
gnltl
on K
ltQ
uick
Sta
rt M
anua
l
T.th
ln 4
- V
oicf
i D
irce
l™ II
Scn
siti
vily
Thr
nsho
ldC
iitifi
nu
ratio
n P
in ('n
iilig
ur.it
mr»
TRA
IN o
pen
drc
ult
Tra
fnln
g/R
ecog
nltlo
n
- E
atta
r Co
traln
, ac
cept
s m
ore
slrn
llai
sour
xitn
g w
ord
i, R
ecog
nlie
s m
ore w
ords
, m
ay s
omeü
mes
(U
tBüt
ute
th«
Tt] jio
rds
(few
er•T
RA
IN p
u'lw
l t»
GN
D w
ith e
1DK
re
sist
or¡trt«
Tra
lnln
g/R
ecog
nltiQ
n -
Har
der to
Crtí
n, reje
cti
mor
e s
imila
ror
ds.
Rec
ognl
ies
few
cr
ytan
ls,
may
so
rneü
mes
re
ject
tra
it>ed
w
ords
tew
er s
ubst
itutto
ns}.
•TR
IG T
flAIN
ope
o cl
rcul
t:a
ster
SC
L/H
CL/
SW
S T
rlgge
r W
ord
perfo
rman
ce
- R
ecog
nlie
s trig
gen
•nor
e qu
lcW
y,
may
so
rnet
lmes
su
bstit
ute
tti
e W
rong
w
ords
(fe
wet
•eje
ctio
ns).
-TR
IG
TRA1
N
pulle
d
ta
GN
D
Wlth
B
esf
itor
«r
5CL/
MC
L/S
WS
Trig
Qer
Wor
d R
ecog
nlüo
n -
Rec
ognU
es tr
lgge
rs m
or*
|y,
may
sor
neU
mes
rej
ect
traln
ed w
ords
(fe
wer
sut
jsttt
utto
nsj.
•Ucr
opíw
rw s
ensl
trvíty
con
flgur
ed fo
r up
to a
rm's
teo
gtti
opür
oaJ
fllst
ance
•REC
OG
pol
led
to G
ND
wlth
e 1
DK res
isto
r•U
crop
hone
sen
sJtfv
lty e
onfig
ured
for
up
to 6
feet
ópt
ima!
dis
tant
e
Som
e ap
pllc
atlo
ns o
f C
ontln
uous
Lls
tenl
ng o
r W
ord-
Spo
ttlng
req
ulre
máx
imum
ac
cura
cy w
lth t
he f
ewes
tfa
lse
trlg
gers
. Thl
s co
nngu
ratlo
n ls
app
ropr
late
for
an
appl
icat
lon
such
as
a llg
ht s
wltc
h, w
here
a fa
lse
trlg
ger
may
be
mor
e th
an a
mln
or in
conv
enle
nce,
Fur
ther
, th
e SC
L, M
CL
or S
WS
reco
gnlz
er in
suc
h an
app
licat
lon
hear
s a
grea
t man
y ph
rase
s th
at
are
not
trig
ger
phra
ses,
so
ther
e a
re m
any
oppo
rtun
lties
for
fal
se t
rigge
rsan
d a
hlgh
le
vel
of
accu
racy
ls
de
slre
d.
A
cons
eque
nce
of
thls
hl
gh
accu
racy
Is
re
latlv
ely
slow
resp
onsl
vene
ss.
Oth
er a
ppllc
atlo
ns -
ga
mes
, for
exam
ple
- ca
n a
ccep
t occ
aslo
nal f
alse
trig
gers
, but
need
fas
t re
spon
se. I
nth
ese
appl
lcat
lons
the
rela
tlve
frequ
ency
of
trlg
ger
phra
ses
may
be
quite
hlg
h, s
o fa
lse
trlg
gerln
g ac
cura
cy ls
less
of
a co
ncer
n.
It sh
ould
be
note
d th
at I
f an
y of
the
thre
e pu
shbu
ttons
Si,
52
or
S3
are
held
dow
n du
rlng
res
et o
r po
wer
-on,
the
Vol
ee D
irect
™ II
wlll
Inte
rpre
t thl
s as
If th
e re
slst
ors
are
In c
ircul
e an
d w
lll c
onfig
ure
Itsel
f to
use
the
strlc
tse
ttlng
for
that
pin.
MO
DU
LE P
IN C
HA
RA
CTE
RIS
TIC
SA
bsol
ute
Máx
imum
Rat
lngs
WA
RH
ING
: S
tnss
lng
the
Vole
e D
írect
™ /
/ be
yotrü
the
'A
bsdu
te
Máx
imum
Rat
íngs
1" "
"X «
use p
erm
ínefít
cla
mas
e. T
Ties
e ar
e s
tres
sra
tings
oflt
y. O
pera
ción
be
ywd
the
"O
pera
tlng
Con
dltio
ns' !
s no
t te
com
tnen
üed
and
exte
nded
exp
osur
e b
eyon
d th
e ~O
pera
tlns
Con
dlO
ons'
may
affe
ftdev
ice
reíla
bim
y.0
.1V
tQ+
6.5
V20
°C t
o +
70°C
1W 20°C
to+7
0°C
;V
po^z
.y-s
.ev
Vss
=O
V
Any
pin
tO
pera
tlng
tem
pera
ture
(T0)
:P
ower
dls
slpa
tlon:
Ope
ratln
g C
ondl
tíons
:
DC
Cha
ract
eris
tlcs
, =
-20
°C to
+70
°C( V
dd =
3.3
V )
SY
MI1
0L
PÁ
SA
ME
TE
» M
1N
TV
P
MA
X
UN
1TS
C
OM
Dm
oN
S
^ *wtV
ík!>
4.S
)
"a ^CM
inputL
ow
Volta
oe
PD
.O-P
1.7,
-R
ESET
Input H
lgti
Vol
tage
PO
.O-P
Í.7,
'RE
SE
T
Out
put L
ow V
olta
geP
O.O
-PI.7
Out
put H
lgh
Vol
tage
PO
.D-P
1.7
-0.1 3.0
0.8
- Vdd
0.3
D.S
*Vdd
0.75
Vdd
4-
0.3
Q.rV
rJd
V V V V
U-Z
rnA
i»--
* m
A
10
p/N
80
-Q2
40
-A©
200
3 Se
nsor
y In
c.
Qui
ck S
tart
Man
ual
Vo
lca_
PIr
ect
™II
Spe
ech
Reco
gnltl
on K
lt
Rocognititm
Word
Ü
LH
I (K
M."
1 u.r
í
(M -i
O;i
. (¡jin
o,"
/
fui
M
Trlggtr
4- G
omm
and W
ord
01
(or
Trlftger
+ N
o C
omm
and
Wor
d» T
rato
ed)
Trlg
aer
+ C
omm
and
Word
02
Trlflf
l«r
4- C
omm
and
Word
03
Trlgger
4- C
omm
and W
ord
04
Trlggw +
Com
man
d W
ord 0
5
Trlg
ger
4- C
omm
and
Word
06
Trlg
ger +
Com
man
d W
ord
0?
Trlgger
4- C
omm
and
Word
Ofl
Trt
gger
4- C
omm
and
Wor
d 0
9
Trf
cfle
r-f
Com
man
d W
ord 1
0
Trlggcr
4- C
omm
and
Word
11
Trlg
ger
4- C
omm
and
Word
12
Trlg
ger
4- C
omm
and
Word
13
Trlgger
+• C
omm
and
Wor
d 1
4
Trlgger
4- C
omm
and W
ord
15
A A
A A
A A
A A
A A
A A
A A
A A A A A A A A
Not
».*
"A">
nd
lc*t
*s t
hat
th
e o
utp
ut*
are
"A
ctív
&4i
lgt\~
MU
LT
I-T
RIG
GE
RC
ON
TIN
UO
US
US
TE
NIN
G (
MC
L)
MO
OE
MC
L m
ode
wor
lts in
a s
imila
r fa
shlo
n to
SC
L m
ode,
exc
ept t
hat
the
mod
ule
ls c
ontln
uous
ly m
onlto
rlng
for
upto
thr
ee t
rlgge
r w
ords
at t
he s
ame
time.
The
com
man
d w
ord
follo
wín
g th
e M
CL
trlg
ger
wor
d w
lll b
e m
atch
ed o
nly
agal
nst
the
tem
plat
es l
n th
eco
rres
pond
lng
set,
If n
o co
mm
and
wor
ds a
re tr
alne
d, t
hen
a su
cces
sful
rec
ognl
tlon
of o
ne o
f th
e M
CL
trlg
ger
wor
ds w
lll c
ause
the
out
puts
to
beha
ve a
s If
the
flrst
com
man
d w
ord
ln t
hat
set
had
been
rec
ognl
zed,
por
exam
ple,
If
no c
omm
and
wor
ds w
ere
traln
ed f
or S
et B
, the
n O
LJT2
and
OU
T4 w
ould
tog
gle
hlgh
. Thl
s fe
atur
els
use
ful l
n ap
pllc
atlo
ns r
equl
rlng
up
to 3
trlg
gers
but
no
com
man
d w
ords
, or
whe
re th
ere
are
múl
tiple
use
rs.
Trtgfle
r W
ord
1
Com
man
d W
ord
1
Triggcr
Word
1
Com
man
d W
ord
2
Trlgger
Word
í
Com
man
d W
ord
3
TrlQ
ícr
Wor
d í
C
omm
and
Word
4
Trlg
ger
Word
1
Com
man
d W
ord
5
Trlogot
Word
2
Com
man
d W
ord
1
Trlgfle
r W
ord
a
Com
man
d W
ord
2
Trt
gg
orW
ort
l3
Com
man
d W
ord
3
Trlg
ger
Wo
rd 2
C
omm
and W
ord
4
Trí
gpar
Word
1
Com
man
d W
ord
5
Trios e
r W
ord
3
Com
man
d W
ord
1
Trlgaer
Word
3
Com
man
d W
ord
a
Trt
gger
Word
3
Com
man
d W
ord
3
Tr$
gger
Word
3
Com
man
d W
ord
4
Trt
gye
rWa
rd 3
C
omm
and
Word
5
A A A A A
A A A A A
A A A A A
A A A
A A A
A A A
A A A
A A AN
onti
"A
"In
dlc
ttfs
tb
at t
he
ou
tptr
ít t
re
"Act
tvft
ilyh
~,
© 2
003
Sens
ory
Inc.
P/N
80
-02
40
-A15
Vo
lee
plrect
™ II
Sp
eech
Reco
gn
ltlo
nK
¡tQ
ul c
kSta
rt M
anua
l
If t
he s
et
conta
lns
8 o
r fe
wer
el
emen
ts,
these
pln
s m
ay
be
use
d t
o c
ontr
ol
actío
ns dlrect
ly.
If
the s
et
cont
alns
mor
e t
han 8
ele
men
ts,
deco
dlng
Is
nece
ssar
y. T
he l
oglc
al
form
at
of t
he o
utp
uts
Is
show
n In
the
table
bel
ow.
Roco
gniti
un
Wo
rrt
O,) i
OLÍ
1,'
(Xii
: u.í
t <
u¡'
s i)
.1 h
ti
;1 ;
O
ti .-;
Co
mm
an
d W
ord
01
Com
mand W
ord
02
Com
mand W
ord
03
Com
mand W
ord
04
Co
mm
an
d W
ord
05
Com
mand W
ord
06
Com
mand W
ord
07
Com
mand W
ord
06
Com
mand W
ord
09
Com
mand W
ord
10
Com
mand W
ord
11
Com
man
d W
ord
12
Com
nia
nd
Word
13
Com
mand W
ord
14
Co
mm
an
d W
ord
15
A A
A A
A A
A A
A A
A A
A A
A A A A A -A A AN
ote
: "A
"/o
tffc
aies
tft
at t
ha
ou
tpu
ts a
n
"Act
tvc-
htg
h".
If
an e
rror
occu
rs during r
eco
gnltl
on (
exc
ep
t fo
r "W
ord
not
reco
gnlz
ed")
, th
en t
he
er
rar
wlll
be
spo
ken
"Spo
ke to
o s
oon"
, "P
icas
e ta
lk louder"
, e
tc.
If t
he
sp
oke
n w
ord
Is n
ot
reco
gnlz
ed f
or
any
reaso
n, n
one o
f th
epl
ns a
re a
ctlv
ated
and
an a
ppro
priate
vol
ee m
essa
ge, "
wo
rd n
ot r
eco
gniz
ed",
Is s
ynth
esl
zed,
For
eac
h co
mm
and w
ord,
Vol
ee D
lrect
™ II
monlto
rs t
he
ba
ckg
rou
nd
nol
se leve
l. V
olee
Dlre
ct™
II
work
s w
ell
wlth
hlg
h (
abou
t 80
dB
) le
véis
of
stea
dy b
ackg
roun
d n
olse
(su
ch a
s a f
an),
but
It
may
ma
ke e
rror
s at
lo
we
rle
véis
If
the
back
grou
nd n
ols
e Is
no
t st
eady
(for
exam
ple,
a T
V s
et)
. B
est
resu
lts w
lll b
e o
bta
lned l
n a
rela
tlvely
qule
t lo
catlo
n.
War
nlng
s m
ay
also
ap
pe
arl
f th
e w
ord
Is
spok
en too s
oftly
, to
o lo
udly
, o
rto
o q
ulck
ly a
fte
r th
e p
rom
pt.
SIN
GLE
-TR
IGG
ER
CO
NTIN
UO
US
US
TE
NIN
G (
SC
L)
MO
DE
Whe
n co
nfig
ure
d fo
r S
CL
mod
e, t
he
Vol
ee D
lrect
™ I
I w
lll,
upon
pow
er-u
p or
rese
t, c
heck
to
see
If a
ny
wor
dsha
ve b
een
traln
ed,
If s
o,
then
Vol
ee D
lrect
™ I
I w
lll I
mm
edla
tely
sta
rt l
lste
nln
g f
or
the
trlgger
word
. If n
ow
ords
tia
ve b
een t
raln
ed,
then t
he
Vol
ee D
lrect
™ I
I w
lll w
alt
for
the
use
r to
tra
ln o
ne
or
mor
e w
ord
s. A
fte
rtraln
lng,
the
-R
EC
OG
pin
can
be b
rought
low
to I
nltl
ate
con
tlnuo
us ll
sten
lng o
pera
tlon.
It Is
Import
ant
to n
ote
tha
t th
e m
odule
ls o
nly
llste
nlng
whe
n th
e T
ALK
LE
D I
s llt.
Use
the
LE
D a
s an
Indl
cato
rof
when
you
can
sp
eak
the tr
igger
and c
om
mand w
ord
s, e
spec
lally
whe
n f
lrst
usl
ng t
he m
odul
e.
Aft
er
succ
essf
ul r
eco
gnltl
on
of
the t
rigger
word
, th
ere
ls
a 3
sec
ond w
lndo
w d
urin
g w
hic
h V
olee
Dlre
ct™
U Is
llste
nlng
for
a c
omm
and w
ord
(If
any
are t
ratn
ed). lf
no
com
man
d w
ord
s ar
e t
raln
ed,
then
a s
ucce
ssfu
lre
cogn
itlon
of
the
trlg
ger
wo
rd w
ill c
ause
the o
utp
uts
to
beh
ave
as
If t
he f
irst
com
mand w
ord
had
bee
nre
cogn
lzed
(O
UT
1 w
ould
toggle
hlg
h).
Thl
s fe
atu
re l
s us
eful
If
only
a s
ingle
trlgger
Wor
d ls
requlre
d.
Note
that
Vol
ee D
lrect
™ I
I do
es n
ot
need
to w
alt
the full
3 s
econ
ds lf
It
hear
s yo
ur
com
man
d w
ord
onc
e It d
ete
cts
the sl
lenc
e a
t th
e en
d o
f yo
ur
uttera
nce
, re
cognltl
on
pr
oces
sIng
w
lll
begl
n I
mm
edla
tely
.When
a
tral
ned
sequ
ence
of
word
s (C
L w
ord
-}•
SD
word
) Is
rec
ognl
zed,
the
appro
priate
Out
put
Pln
(s)
wlll
pul
se h
lgh
for
1se
cond
;
P/N
80
-02
40
-A©
200
3 S
enso
ry I
nc.
Qul
ck S
tart
Man
ual
VüI
cejH
rect
"' I
I Sp
eech
Rec
ognl
tlon
Klt
k Coc
í
w Bpu
Lojfc
"! 0
Input C
urre
nt
Sup
piy
Curren!, O
pera
ting
Sup
ply
curr
ent,
Qul
esce
nt
puH
-up r
esl
ftance
,P
Q.O
-P1.
75,
80,
Hl-Z
<1
37 4
6,5
, 2D
D,
HI-Z
10 IDü 6
uA mA
mA
K-o
hrn
</»
<V
»,<V
N
•fl-Z
Out
puts
HI-Z
Out
puts
Sei
ecttf
d w
lch
softw
are
7. T
rain
lng
Voi
ce D
lrec
t™ I
IE
DG
E-T
RIG
GE
RE
D S
ING
LE
-RE
CO
GN
ITIO
N (
ES
R)
MO
DE
The
mod
ule s
houl
d b
e c
onfig
ured
for
SD
Mod
a. W
hen
the -
TR
AIN
pin
Is
pulle
d t
o G
ND
for
at l
east
lO
Om
S(s
uch a
s by
pus
hlng
a m
om
enta
ry p
ush
butto
n,
labele
d ¡n
fig
ure 2
as
"Sl
(Tra
ln)"
), t
raln
lng w
lll b
egln
. V
olee
Dlre
ct™ II
wlll
pro
mpt
"Say
wo
rd x
" (w
here
x c
orre
spon
ds t
o the
wo
rd to b
e tr
aln
ed).
A tra
lned
wor
d o
r ph
rase
must
be n
o lo
nger
than
2.5
sec
onds
and m
ay
not
conta
ln s
lfenc
es lon
ger
than
0.5
seco
nds.
For
exa
mple
, th
e ña
me
"Doh
n S
mlth
" w
ould
be
an a
cce
pta
ble
phr
ase
as lo
ng a
s th
e tw
o w
ord
s ar
eno
t se
para
ted
by a
larg
e p
ause
. Tra
lnln
g t
erm
lnate
s w
hen
no w
ord
Is s
poke
n In
resp
onse
to a
pro
mpt,
when
any
push
butto
n I
s pre
ssed
a s
econ
d tim
e d
urin
g t
raln
lng,
wh
en th
ree e
rror
s ha
ve o
ccurr
ed d
urin
g tra
lnln
g,
orafter
atl is
wo
rds
ha
ve b
een tr
aln
ed.
Brin
glng
the
-T
RA
IN p
in l
ow a
t a l
ate
r tim
e r
esum
es t
raln
lng.
New
wor
ds a
re a
dded
to
the
end
of
the
set
atre
ady
reco
rde
d,
New
wor
ds m
ay b
e a
dded
to t
he s
et a
t an
y tim
e, u
p t
o a
máxi
mum
of
LS w
ord
s. Indiv
idual
wor
ds from
the s
et
may
not
be d
ele
ted a
r ove
rwrttte
n,
but
the entlr
e s
et
can b
e e
rase
d (
see "
Era
sing
Tem
ple
tes"
, se
ctlo
n 7
), T
he
use
r sa
ys t
he f
lrst
wo
rd to
be tr
aln
ed,
then
Vol
ee D
irect
™ II
pro
mpts
aga
ln w
lth"P
ep
ea
r. T
he
use
r re
peats
the
word
, and
Vol
ee D
lrect
™ II
wlll
retu
rn "
Acc
ep
ted
" If
the
wo
rd h
as
been
succ
essf
ully
tra
lned.
Oth
erw
lse,
It
wlll
ind
ícat
e t
he
cau
se o
f th
e t
raln
lng
err
or,
If a
n e
rror
occu
rs d
urin
gtraln
lng,
then t
he
err
or w
lll b
e s
poke
n "
Spoke
too s
oon"
, "P
leas
e ta
lk louder"
, etc
, T
he
use
r w
lll g
et
thre
ea
tte
mp
ts t
o tra
ln e
ach
WQ
rd b
efo
re V
olee
Dlre
ct™
II e
xlts
tra
lnln
g m
ode,
and
say
s "T
rain
lng
com
ple
te".
The
use
r ca
n e
xlt
traln
lng
ac
any
time
by
brin
gln
g t
he -
TR
AIN
or
the
-R
EC
OG
pin
low
, by
not
res
pond
lng
to
a"S
ay
wo
rd x
" o
r"R
ep
ea
t" p
rom
pt, o
r w
hen s
il 15
word
s h
ave
bee
n tra
lned.
Exa
mp
le (
SO
):
Act
lon:
Vol
ee D
lrect
™ H
:U
ser:
Vok
e D
lrect
™ II:
Use
n
Vol
ee D
irect
™ I
I:U
ser:
Vol
ee D
lrect
™ I
I;U
ser:
Vol
ee D
lrect
™ 11
;U
ser:
Vol
ee D
irect
™ 1
1;U
ser;
Brln
g -T
RA
IN p
in lo
w"S
ay w
ord
one"
•Sta
rt"
"Rep
eat"
"Sta
rt"
"Say
wor
d tw
o"
"Shu
tdow
n""R
epea
t""S
hutd
own"
"Say
won
J th
ree"
"Ugh
ts"
"Rep
eat"
"Ugh
ts-
Act
lon:
Brín
g -T
RA
IN p
in lo
w
Sta
rt
tral
nlng
Tral
nlng
fírs
t co
mm
and
Wor
d
Tral
nlng
sec
ond
com
man
d w
ord
Trai
nlng
thl
rd c
omm
and
won
í
Sto
p t
raln
lng
Not
e; V
olee
Dlre
ct1"
II
wiH
con
tinué
to
prom
pt fo
r ne
w w
crds
to
traln
unt
il al
l IS
mem
ory
loca
tíons
hav
e be
en fH
Ied.
To
stop
tra
lnln
g, b
rfng
the
-TR
AIN
pin
IQW
aga
ln.
SIN
GLE
-TR
IGG
ER
CO
NT
INU
ÓO
S L
IST
EN
ING
(S
CL)
MO
DE
The
mod
ule s
houl
d b
e c
onfig
ure
d f
or S
CL
Mod
e. I
n t
hls
mod
e, s
epár
ate
plns
are
use
d to
tra
ln t
he
trlg
ger
wo
rd (
-TR
1G T
RA
IN p
in)
and t
he c
omm
and
wo
rds
(-T
RA
IN p
in).
Aft
er
traln
lng
the
trlgger
Wor
d, u
p t
o 1
5co
mm
and
wor
ds c
an b
e tr
aln
ed.
© 2
003
Sen
sory
Iri
c.P
/N 8
D-Q
24P
-A
Vo
lca
Dir
ect1
* IX
Sp
eech
Ree
og
nlt
lon
Kit
Qui
ck S
tart
Man
ual
Exa
mp
le (
SC
L):
Act
lon:
Voi
ce D
irect
™ I
I:U
ser;
Voi
ce D
irect
™ II:
Use
n
Act
lon:
Vol
ee D
Irec
t™ I
I;U
ser:
Vol
ee D
irect
™ I
I:U
ser:
Vol
ee D
irect
™ I
I:U
ser:
Vol
ee D
irect
™ II;
Use
r:
Voi
ce Q
irect
™ I
I:U
sen
Voi
ce D
Irect
™ I
I:U
ser:
Brin
g -T
RIG
TR
AIN
pin
loW
"Say
wor
d on
e""S
ound
Sys
tem
*"R
epea
t""S
ound
Sys
tem
"
Brin
g -T
RA
IN p
in lo
w"S
ay w
ord
one"
"Sta
rt"
"Rep
eaf
"Sta
rt"
"Say
wor
d tw
o""S
hutd
own"
"Rep
eat"
"Shu
tdow
n"
"Say
wor
d th
ree"
"Ugh
ts"
"Rep
eat"
"Llg
hts
"
Sta
rt t
rlgg
er
wor
d tr
alni
ngTr
alni
ng t
rigge
r w
ord
Sta
rt c
omm
and
wor
ds t
rain
lng
Tral
ning
firs
t co
mm
and
wor
d
Traí
nlng
sec
ond
com
man
d w
ord
Tral
ning
thl
rd c
omm
and
wor
d
Act
lon:
B
ring
-TR
AIN
pin
low
S
top
tral
ning
Mgt
fi¿ V
olee
DIre
ct™
II w
HI c
ontin
ué t
o pr
ompt
for
new
wor
ds t
o tra
ln u
ntil
all
15 m
emor
y lo
catlo
ns h
ave
been
filie
d. T
ost
op tr
alnl
ng,
brin
g th
e -T
RA
IN p
in lo
w a
galn
.
MU
LT
I-T
RIG
GE
R C
ON
TIN
UO
US
LIS
T6N
ING
(M
CL
) M
OD
ET
he m
odul
e sh
ould
be
co
nflg
ure
d fo
r M
CL
Mod
e. T
he t
raln
ing
seq
uenc
e Is
ve
ry s
imila
r to
SC
L m
ode,
exc
ept
that
3 s
epár
ate
trlg
ger
wo
rds
can
be t
raln
ed,
Aft
er
traln
ing
ea
ch trlg
ger,
up
to
-5 c
om
ma
nd
wor
ds c
an b
etr
ain
ed
whl
ch a
re a
ssoc
late
d W
ith t
ha
t tr
igger
wor
d. i
t Is
Im
po
rta
nt
to n
ote
th
at
each
co
mm
and
set
mu
sí
be
tral
ned
¡m
med
late
ty
follo
wln
g
the
corr
csp
on
dln
g
trlg
ger
w
ord
. O
nce
the
nex
t tr
ígg
erw
ord
Is
tral
ned
, th
en
is
no
way
to
go
ba
ck
an
d r
e-t
rain
a c
om
man
d s
ef w
lth
ou
t er
asln
g t
he
en
tlre
mem
ory
. T
ryln
g t
o t
raln
tw
o s
imila
r tr
igger
wor
ds w
ill r
esu
lt In
a "
too
sim
ilar"
err
or.
Dur
lng
the t
raln
ing
of
the
com
man
d se
t, ea
ch c
om
ma
nd
wo
rd I
s ch
ecke
d fo
r sl
mlla
rtty
to o
ther
com
ma
nd
wo
rds
In It
s se
t, bu
t na
tag
alns
t th
ose
In o
ther
set
s.
MC
L m
ode
can
be u
sefu
l fo
r a
sing
le
user
pro
duce
usl
ng m
últi
ple
ga
tew
ay
com
man
ds,
or f
or
multl
-use
rap
pllc
atlo
ns w
her
e ea
ch u
ser
would
tra
ln n
¡s o
r he
r ow
n trlg
ger
and
co
mm
an
d w
ord
s,
Exa
mp
le (
MC
L):
Act
lon:
Voi
ce D
irect
™ I
I:U
ser:
Vol
ee D
irert™
II:
Use
r:
Act
lon:
Vot
ce D
irect
™ II;
Use
nV
olee
Dire
ct™
II:
Use
r:
Vol
ee D
irect
™ I
I:U
ser:
Vol
ee D
irect
™ II:
Use
r:
Act
lon
:
Act
lon;
Vole
e D
Irect
™ II:
Brin
g -
TR
IG T
RA
IN p
in lo
w"S
ay w
ord
one"
"Sou
nd S
yste
m"
"Rep
eat"
"Sou
nd S
yste
m"
Brin
g -
TR
AIN
pin
low
"Say
wor
d on
e-on
e""S
tart
""R
epea
t""S
tart
"
"Say
wor
d on
e-tw
o""S
hutd
own"
"Rep
eaf
"Shu
tdow
n"
Brin
g -T
RA
IN p
in lo
w
Brin
g -T
RIG
TR
AIN
pin
low
"Say
wor
d on
e"
Sta
rtsetl
rr
/ffjj
er
wor
d tr
alni
ngTr
alni
ng s
et 1
tríg
ger
wor
d
Sta
rt s
et 1
com
man
d w
ords
tra
lnin
gTr
alni
ng s
eí 1
fírs
t com
ffand
wor
d
Tral
ning
se
t i s
econ
d co
mm
and
wor
d
Sto
p tr
alni
ng
Sta
rt s
et
3 t
rlgge
r w
ord
tral
ning
Tral
ning
set
2 t
rigge
r w
ord
P/N
80
-02
40
-A©
200
3 S
enso
ry I
nc.
Qui
ete
Sta
rt M
anua
lV
olee
jMre
ct™ II
spe
ech
Rec
ognl
tlon
Klt
Use
r:Vo
lee
DIre
ct™ II;
Use
n
Act
lon:
Voi
ce D
Irect
™ I
I:U
ser;
Voi
ce D
Irect
™ II
:U
ser;
Voi
ce O
lrect
™ II:
Use
rjV
oice
DIre
ct™
II:
Use
r;
Act
lon:
"Sou
nd S
yste
m"
"Rep
eat"
"Sou
nd S
yste
m"
Brin
g -T
RA
IN p
in lo
w"S
ay w
ord
two-
one"
"Sta
rt"
"Rep
eat"
"Sta
rt'
"Say
wor
d tw
o-tw
o""S
hutd
own"
"Rep
eat"
"Shutd
ow
n"
Brin
g -T
RA
IN p
in lo
w
Sta
rt s
et 2
cam
man
d w
ords
tra
lnin
gTr
alni
ng s
et 2
firs
t co
mm
and
wor
d
Tral
ning
set
2 s
econ
d co
mm
and
wor
d
Sto
p tr
alní
ng
Í V
oice
Dire
ct™
1! w
lll c
ontin
ué to
pro
mpt
for
new
wor
ds t
o tra
ln U
ntil
all S
mem
ory
loca
trons
for
eac
h tri
gger
wor
dha
ve b
een
filie
d. T
o st
op t
rain
lng,
brin
g th
e -T
RA
IN p
in lo
w a
gain
.
SIN
GL
E-T
RIG
GE
RW
OR
D-S
PO
TT
ING
MO
DE
(S
WS
) M
OD
ET
he m
odul
e sh
ould
be
con
figur
ad f
or
Wo
rd-S
po
ttln
g M
ode.
In
thl
s m
ode,
se
pá
rate
pln
s ar
e u
sed
to t
raln
the
trig
ger
wo
rd (
-TR
IG T
RA
IN p
in)
and th
e c
om
ma
nd
wor
ds (
-TR
AIN
p]n
). A
fte
r tr
aln
ing
the t
rigger
word
, up t
o15
com
man
d w
ords
can
be
tra
lned
, T
he m
aln d
lffere
nce
bet
wee
n th
e t
wo
co
ntln
uous
Ils
tenl
ng m
odes
(S
CL
and
MC
L) a
nd s
lng
le-t
ríg
ge
rwo
rd-s
po
ttln
g (
SW
S) I
s th
at
a cc
ntin
uous
Ilste
nln
g trlg
ger
wor
d m
ust
be
spok
enby
Its
elf,
wlth
i at
leas
t ,2
5s o
f sl
lenc
e b
oth
bef
are
and
aft
er
the
wor
d, w
hlle
wo
rd-s
po
ttln
g t
rlgger
wo
rds
may
be e
mbe
dded
ln t
he m
lddl
e o
f a
sen
tenc
e,, I.e
. no
bef
are
and
aft
er
slle
nce
Is n
eede
d.
Exa
mple
(S
lngle
-Trlgger
Word
-Spottln
g):
Act
lon
:V
oice
DIr
ect™
I!;
Use
r:V
oice
DIr
ect™
II:
Use
r:
Act
lon:
Voic
e D
Irect
™ II;
Use
r:V
oice
DIre
ct™
u¡
Use
r:
Voi
ce D
Irect
™ II:
Use
r:V
olee
DIre
ct™
II:
Use
r:
Vol
ee D
irect
™ U
:U
ser:
Vol
ee D
irect
™ U
:U
ser:
Act
iom
Brin
g -
TR
IG T
RA
IN p
in lo
w"S
ay w
ord
one"
"Sou
nd S
yste
m"
"Rep
eat"
"Sau
nd S
yste
m"
Brin
g -
TR
AIN
pin
low
"Say
wor
d on
e""S
tart
""R
epea
t""S
tart
"
"Say
wor
d tw
o""S
hutd
own"
"Rep
eat"
"Shu
tdow
n"
"Say
Wor
d th
ree"
"Ugh
ts"
"Rep
eat"
"LIg
hts
*
Bri
ng
-TR
AIN
pin
low
Sta
rt t
rigg
ar w
ord
tral
ntn
gTr
alni
ng t
rigge
r w
ord
Sta
rt c
omm
and
wor
ds t
rain
lng
Tral
ning
firs
t co
mm
and
wor
rf
Tral
ning
sec
ond
com
man
d w
ord
Tral
ning
tnl
rd c
omm
and
wor
d
Sto
p tr
alni
ng
eí V
oice
Dire
ct™
II w
ilf c
ontin
ué t
o pr
ompt
for
new
wor
ds t
o tra
ln U
ntll
al[
15 c
omm
and
wor
ds h
ave
been
tra
ined
. To
stop
tral
ning
, brin
g th
e -T
RA
IN pi
n lo
w a
gain
.
8. R
eco
gn
izin
g W
ord
sE
DG
C-T
RIG
GE
RE
D S
ING
L6
-RE
CO
GN
ITIO
N (
ES
R)
MO
DE
Whe
n th
e -
RE
CO
G p
in I
s pu
lled t
o
GN
D f
or at
lea
st l
OO
mS
, re
cognltl
on w
lll b
egin
. V
olee
Dire
ct™
II
wlll
pro
mpt
"Say
a w
ord
". If
the
res
pons
e Is
not
rec
ognl
zed,
Vol
ee D
irect
™ II
wlll
say
"W
ord
not
reco
gnlz
ed"
and
exit
reco
gnltl
on
mod
e.
If th
e sp
oken
wor
d m
atc
he
s a
sto
red
tém
pla
te,
one
or
two
of
8 outp
ut
plns
ar
ea
ctlv
ate
d (p
ulle
d h
lgh
for
ap
pro
xlm
ate
ly o
ne s
econ
d) a
nd a
vol
ee m
essa
ge In
dlca
tes
the
matc
hln
g r
espo
nse.
© 2
003
Sen
sory
In
c.P
/N S
D-0
24
0-A
13
S E N S O R Y RSC-300/364Speech Recognition Microcontroller
DATA SHEET
General DescriptionThe RSC-300/364, from the Interactive Speech ™family of producís, ¡s designed specifically forspeech applícations ¡n consumer electronicproducts.
The RSC-300/364 combines an 8-bit processor withneural-net algorithms to provide high-qualityspeaker-independent speech recognition, speaker-dependent speech recognition, and speakerverification. The chip also supports speechsynthesis, voice record/playback, 4-voice musicsyníhesis, and system control. This CMOS deviceincludes on-ch¡p RAM, ROM (RSC-364 only), 16general-purpose I/O unes, A/D and D/A converters,a microphone pre-amplifier, and a 4-MIPS dedicatedprocessor. The RSC-300 ¡s designed for ROM-Iessappücations that need more ROM space andconsequently use off-chip memory.
In addition ío providing the horsepower needed toperform speech recogniíion and speech synthesis,the processor has suffícient cycles available forgeneral-purpose product control. The RSC-300/364Development Kit allows developers to créatecustom applicaíions. The Development Kit includesan assembler, linker, simulator, hardwaredevelopment platform, and library of Sensorytechnology object code.
The highly integrated nature of this chip reducesexternal parís count. A complete system may bebuilt with only a few passive components in additionto a batíery, speaker, and microphone. Low powerrequirements and low-voitage operation make theRSC-300/364 an ideal solution for battery-poweredand hand-held devices.
The RSC-300/364 uses a pre-trained neuralnetwork to perform speaker-independent speechrecognition, while high-quality speech synthesis isachíeved using a time-domaín compression schemethaí improves on conventional ADPCM. Four-voicemusic synthesis allows múltiple, simultaneous¡nstruments for harmonizing. Automatic GainControl can compénsate for people not optimallypositioned with respect to the microphone or forpeople who speak too softly or loudly.
FeaturesHigh-Performance Processor
y 4-MIPS performance at 14.32 MHzy 16 general purpose I/O linesy Interrupts, timers and countersy Fully static operation; clock rate: DC to 14.32
MHz
Highly-lntegrated Single-Chíp Solutiony Internal 64 kB of ROM (364 only), 2.5 kB of
RAMy 12 bit A/D (Analog to Digital) convertery Microphone Pre-amplifiery Internal 32kHz secondary timery 24 x 24 Multipliery Can store 6 Speaker Dependent words on-
chíp
Low Power Requirementsy Requíres single 2.85V to 5.25V power supplyy ~1 OmA operating current at 3Vy Low Power 32kHz oscillatory Power-down current less than 5 joA
High-Quality Recognition and Synthesis> Recognition accuracy; better than 97%
(Speaker Independent) and 99% (SpeakerDependent).
y Synthesis data rates from 5,000-15,000 bitsper second
y 4-voice music synthesis capabilitiesy AGC control compénsales for variations in
input signal
Easily Expanded to Larger-Scale Systemsy Sepárate 16-bit Address and 8-bit Data
buses compatible with common memorycomponents
y Sepárate Code and Data address spacesand memory strobes
> 2001 Sensory Inc. P/N 80-0165-O
RSC-3QO/364
IntroductionThe RSC-300/364 is íhe newest member in a family of high-performance 8-bit microprocessors featuring a highlevel of integration, targeted ío high-accuracy, low-cost speech recognítion applications. The RSC-300/364 isdesignad to bring accuracy, fast response time and versatility to low-cost, power-sensitive consumerapplications.
A design goal of the RSC-300/364 was to reduce total system cost while increasing system performance. Byincluding microphone signal amplification, data conversión, recognition and synthesis functionality, and ROMstorage (RSC-364 only) with a CPU core on a single chip, dramatíc cost and power reductions are achieved.Thus, the RSC-300/364 is able to provide 4 MIPS of integer performance at 14,32 MHz. This allows customerapplications to achieve máximum performance at mínimum cost.
The CPU core embedded in the RSC-300/364 is an 8-bit, variable-length-instruction, microprocessor. Theinstruction seí is most similar to the 8051 family of microcontrollers. The RSC-300/364 processor avoids thelimitatíons of dedicated registers by havíng compieteiy symmetrical source and destinations for all instructions.Of the 2.5 Kbytes of ¡nternal SRAM, 2 Kbytes are organízed as a Data Space, and 0.5 Kbytes is for registerspace. All ariíhmeíic operation ¡nstructions may be applied to any register. Any pair of adjacent registers (at aneven address) may be used as the 16-bít pointer to either the source or desíination for a data movementinstruction. Instrucííon classes allow the pointer to access internal or external Code Space, internal RegisterSpace, or external Data Space.
Architecturally, the RSC-300/364's sepárate data and address buses allow use of standard EPROMs, ROMs,and SRAMs with little or no additional decoding. Provisión for sepárate read and write signáis for each externalmemory space further simplifies interfacing.
Creating applications using the RSC-300/364 requires the development of electronic circuitry, software code,and speech/music data files ("linguistics"). This document provides detailed ¡nformation on those aspects of theRSC-300/364 architecture that are important to product designers and programmers. It describes the physicalinterface ío the chip, printed circuit board layout and other design considerations, the RSC-300/364's ínsíructionseí, and memory organizaron. Refer ío the RSC-300/364 Development Kií Manual for information on usingSensory's technology code for speech recognition, speaker verifícation, speech syníhesis, and voice record andplayback. Descripíion of vocabulary developmení ("linguisíics") informaíion is beyond the scope of thisdocument and ¡s covered in a Design Note.
Custom Mask Capabilities ofthe RSC-364The RSC-300 provides significant and flexible expansión capabilities through the use of external RAM or ROMProducts using the custom-mask versión of the chip, the RSC-364, may save considerable per-unit cost byavoiding the need for other active devices. The RSC-300 requires an external Code Space ROM memory tocontain the program instructions, synthesis data, and Speaker Independent recognition weights. The custom-masked RSC-364 with no additional external memory devices must rely on the fixed internal memory for all of ítsROM and RAM requirements. The internal ROM in íhe RSC-364 ¡s applicatíon specific, with the amountavailable for user applications decreasing as the number of synthesis words or other technology usageincreases.
These finite resources resírict íhe capabilities of producís based on íhe RSC-364. The product specifícaíion foríhe RSC-364 must be carefully crafíed in consultaíion with Sensory to maximize the use of on-chip memory.Each application will have iís own specific limitaíkms, buí the table below summarizes some useful guidelinesfor planning purposes. Not all ofthe máximums can be achieved in a single custom-masked RSC-364 design.For example, a recogniíion vocabulary of 40 words may limit the speech synthesis ío substantially less than 25seconds.
Note: The RSC-364 (Custom Mask) column assumes no external memory.
> 2002 Sensory Inc. P/N 80-0165-O
RSC-300/364 Data Sheet
Description RSC-300 RSC-364(Custom Mask )1
Capabilities:
Speaker independen! (SI) recognitionSpeaker dependení (SD) recognitionSpeech syníhesis and special sound effects
Speaker verificationFour-voice music generation
Voice record and playback
ssss•/s
sLimited
^•/
Limited supportNotsupported6
SI Recognition Capacity :
Máximum number of words per recognition set1Total recognítion vocabulary sfce in words, all sets
15Unlimited
1540 words3
SD Recognition Capacity :
Máximum number of words per recognition set1Total recognition vocabulary size in words, all sets
642
Unlimited6J/64"
6-75124
Speaker Verification Capacity:Number of speakers identified per set1 642 17644
Synthesized Speech Capacity:Máximum total length of all messages Unlimited 25 seconds
Music Synthesis CapacityNumber of simultaneous independent musicalvoicesNumber of musical octaves availableNumber of musical tunes available Unlimited
Reguirement for custom ROM masks:
Custom-masked parís (RSC-364) are not stockedby Sensory
No Internal ROM Custom maskedROM required
1. Software forthe RSC-364 (Cusiom Masked) applications may be completely developed and verified using the RSC-300/364Development Kit and an external 64K ROM memory before committing to an RSC-364 custom ROM rnask.
2. Practical limitations ío mainíain accuracy above 95%.3. Assumes íhe use of on-chip ROM/RAM only4. Assumes external serial EEPROM memory.5. Depends on choice of musical instrument.6. Requires external storage for recordings.
P/N80-0165-O ©2002 Sensory Inc.
Data Sheet RSC-300/364
Rsc-300/364 Hardware Specifications
Architectural Overview of the RSC-300/364The RSC-300/364 ¡s a highly integrated devicethat combines:
• An 8-b¡í RISC microprocessor.• On-chip ROM (64 Kbytes, RSC-364 only),
Register RAM (448 bytes), Data RAM (2Kbytes) and the ability to address off-chipRAM or ROM.
• Analog-to-digital converter, digital-to-analog converter, and a pulse widthmodulator.
• A microphone pre-amplifier
The RSC-300/364 has an external memoryínterface for accessing external RAMs, ROMsor other parallel memory devices. The RSC-364 also has an internal ROM that can beenabied or disabled (partially or fully) by pininputs (signáis -XMH, -XML; See figure 4). ).When the internal ROM of the RSC-364 isdisabled, its performance is identical to theRSC-300. With the RSC-364, the entireprogram must reside in the internal maskedROM. Externa! memory can only be used tostore data.
The 8-bit processor can directly access 448on~ch¡p general-purpose registers (RAM), and32 additional Special Functions Regísíers(SFRs). The instruction set accessing theseregisters ¡s completely symmetrical, allowingmovs, arithmetic, and logical operations withany register as the destination. Two bi-directional ports provide 16 general-purpose I/O pins to communicatewiíh external devices (See page 9). The RSC-300/364 has a high frequency (14.32 MHz) oscillator as well as alow frequency (32,768 Hz) oscillator. The processor clock can be selected from eíther source, with a selectabiedivider valué. Sensory's technology code requires the use of the 14.32 MHz clock. There are twoprogrammable 8-bÍt couníers / timers, one derived from each oscillator. A variety of wait state configurationsallow fast code execution and easy ¡nterfacing to slow peripheral memories.
An inexpensive electret microphone connects directly to the microphone input of the RSC-300/364. The internalpreamplifier converts the tiny microphone signal to a level suitable for Analog-to-Digital Conversión. (ADC), TheRSC-300/364 uses a Sample and Hold (SH) circuit and ADC converter to convert the ampiified analog speechsignal into digital data. The chip may also be used with line-leveí inpuís. The output audio signal of the RSC-300/364 is derived eitherfrom a DAC (Digital-to-Analog Converter) or a PWM (Pulse Width Modulator).
In addition to its on-chip ROM (RSC-364 only) and RAM, the RSC-300/364 has 8 data lines (D[7:0]) and 16address lines (A[15:0]), along with associated control signáis (-RDC, -RDD, -WRC, -WRD, -XML, -XMH) for¡nterfacing to external memory. The memory control signáis on the RSC-300/364 and the processor instructionset provide independent Code and Data spaces, allowing configuration of systems up to 192 Kbytes with noaddííional hardware decoding. The RSC-300/364 features 16 general-purpose I/O pins (Px.y) for product andmemory bank control.
P1.0-P1.7
Figure 1 - RSC-300/364 Block Diagram
© 2002 Sensory Inc. P/N 80-0165-O
RSC-300/364 Data Sheet
Using the RSC-300/364Creating applications using the RSC-300/364 requires the development of electronic circuitry, software code,and speech/music data files. Software code for the RSC-300/364 can be developed by Sensory or by externalprogrammers using the RSC-300/364 Development Kit For more Information about development tools andservices, please contact Sensory, or visit www.Sensorylnc.com. A typical product will require about $0.30 -$1.00 (in high volume) of addítionai components, in addition to the RSC-300/364.
The foliowing sample circuit provides an example of how the RSC-300/364 might be used in a iow volumeconsumer electronic product. The external ROM coníains the applicaíion program, recognítion weights, andspeech data. A high volume application would likeiy use an RSC-364 (custom-masked ROM), and would notrequire the sepárate ROM.
•í >EXTERMA1_ AMPUF1ER (OPT1ONAL)
(*) See 'Analog Desígn" section
n The RSC-364 OFP has a diñaren! pinout
(***) This oscillator ¡s availabla only wlh RSC-364 d 0 package
Figure 2 - Reference Circuit
Woíe; Applications using the PWM outpuí may not meet FCC or CE (such as EN55022 Class A or B) standards for radiated emisslons. Forapplications tnat musí meet these standards, Sensory recommends turning off the PWM in the application software, and using an externalaudio power ampllfier connected to the DAC ouíput. Please refer to Sensory's Application Note 80-0105 "DAC Output" for sample circuitsand design guídelines.
P/N 80-0165-O 12002 Sensory Inc.