John P. Mckelvey - Física Del Estado Solido Y De Semiconductores-limusa Noriega Editores (1996).pdf

  • Uploaded by: karen maria camino galvez
  • 0
  • 0
  • January 2021
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View John P. Mckelvey - Física Del Estado Solido Y De Semiconductores-limusa Noriega Editores (1996).pdf as PDF for free.

More details

  • Words: 217,300
  • Pages: 536
Loading documents preview...
Temas que trata la obra: • • • • • • • • • • • • • • • •

Redes cristalinas y tipos de cristales Análisis cristalográfico con rayos X Dinámica de las redes cristalinas Mecánica cuántica, generalidades Mecánica estadística, generalidades Vibraciones reticulares y propiedades térmicas de los cristales Teoría del electrón libre de los metales Teorí~ cuántica de los electrones en redes periódicas Semiconductores electrónicos uniformes en equilibrio Exceso de portadores en semiconductores Tecnología de materiales y medición de propiedades volumétricas Teoría de las uniones p-n de los semiconductores Rectificadores de la unión p-n y transistores Uniones p-n a niveles altos de corrientes; el rectificador p-i-n Otros dispositivos semiconductores Contactos metal-semiconductor y superficies de semiconductores

,6flll""'

FISIC ,

DEL ESTADO SOLIDO Y DE SEMICONDUCTORES

J. P. McKELVEY

~LIMUSA NORIEGA EDITORES MÉXICO • Eapel\a • Venezuela • Colombia

VERSIÓN AUTORIZADA EN ESPNIOL DE LA OBRA PUBLICADA EN INGLéS CON EL TITULO: SOLIO STATE ANO SEMICONDUCTOR PHYSICS O HARPER & Row PuBLISHERs, INc. COLABORADOR EN LA TRADUCCIÓN: HORTENSIA CORONA RODRÍGUEZ INGENIERO DE LA UNIVERSIDAD DE CALIFORNIA, 8eRKELEY. REVISIÓN: FRANCISCO RESÉNDIZ RODRÍGUEZ MAESTFÚA EN CIENCIAS EN INOENIERIA ELéCTRI• CA DEL CeNTRO DE INVESTIGACióN Y EsTUDIOS AVANZADOS, PROFESOR DE ELECTRÓNICA DE LA EscueLA SuPERIOR DE INOENIERfA MECÁNICA Y ELéCTRICA DEL INSTITUTO PouTéCNICO NA· CIONAL, MéxiCO.

LA PRESENTACIÓN YDISPOSICIÓN EN CONJUNTO DE FÍSICA DEL ESTADO SÓLIDO Y DE SEMICONDUCTORES SON PROPIEDAD DEL EDITOR. NINGUNA PARTE DE ESTA OBRA PUEDE SER REPRODUCIDA O TRANS·

MlliDA, MEDANll: NfGÚN SISTBM O MÉlalO, B..EC· TIÓIIICO o aECÑICO (N:W'fENX) afOitlCXlPWlO, LA GRABACIÓN O CUALQUIER SISTEMA DE RECUPE· RACIÓN Y ALMACENAMIENTO DE INFORMACIÓN), SIN CONSENTIMIENTO POR ESCRITO DEL EDITOR.

DERECHOS RESERVADOS:

O 1996, EDITORIAL LIMUSA, S.A. DE C.V. GRUPO NORIEGA EDITORES BALDERAS 95, MéJOCO, D.F. C.P. 06040

i l 521·21.05 Q 512·29.03 CANIEM NúM. 121 NovENA RBMPRESIÓN HECHO EN MéxiCO ISBN 968·18·0431·7

Prólogo Este libro se basa en el material que utilicé para impartir cursos especiales de dos semestres a los estudiantes de las carreras de física, ingeniería eléctrica, metalurgia y ciencias de materiales. Por lo común, el primer semestre de estos cursos se dedica ala física general del estado sólido y el segundo, a un estudio detallado de los materiales y dispositivos semiconductores, incluyéndose en él (además de una gran cantidad de material nuevo) muchas aplicaciones de los principios desarrollados en la sección introductoria del curso. Por consiguiente, la obra es fundamentalmente un libro de texto para un curso de este tipo. Esperamos que su alcance sea lo suficientemente amplio y la exposición de los aspectos fundamentales, lo suficientemente detallada y clara para que también sirva como libro de consulta general para los ingenieros y otros profesionales que trabajan en el área de investigación y desarrollo de los materiales y dispositivos semiconductores. En vista de que este material puede interesar a los estudiantes y profesionales de carreras muy diversas, se incluyeron los capítulos sobre mecánica cuántica y mecánica estadística, por creer que serían muy útiles para algunos. Sin embargo, cabe señalar que con estos capítulos no se pretende suplir un curso completo de estos temas, ya que sólo se trata df. breves ensayos introductorios que le proporcionan al lector los conocimientos necesarios para seguir el desarrollo del tema y entender el significado físico de los conceptos presentados. Desde luego, para apreciar debidamente la importancia que tienen los fenómenos cuánticos y estadísticos en la física del estado sólido, no queda otra, sino estudiarlos a fondo. A lo largo de la obra, los temas se presentan desde el punto de vista de la física; por otra parte, se incluyen muchos detalles técnicos sobre temas tales como tecnología de materiales y crecimiento de cristales; fabricación de dispositivos semiconductores; características y configuración de circuitos de estos dispositivos, y para proporcionar un panorama más completo, se indican las obras que conviene consultar, si se desea obtener datos más concretos y detallados en relación con estos temas. Traté de presentar en forma exhaustiva la teoría de la unión p-n y el análisis del dispositivo semiconductor y dar una explicación completa y detallada de las técni<:as analíticas que se utilizan en este campo tan importante, pero tan descuidado.

Prólogo 6

Los conceptos de la física general del estado sólido que se estudian en la sección introductoria, capítulos del 1 al 8, sólo abarcan aquellos que tienen una importancia central en la física de los semiconductores. Por lo tanto, esta introducción es más bien selectiva que completa; peri, aun así, contiene el material suficiente para un curso completo, de nivel intermedio, sobre la física del estado sólido. Desde luego, un libro de texto de tamaño normal no puede abarcar un estudio de dieléctricos, magnetismo, centros de color, experimentos de resonancia y otros temas que por lo general se tocan en los cursos de física del estado sólido. El nivel de presentación es intermedio; he tratado de ir mucho más allá de lo que puede lograrse con un enfoque cualitativo, sin recurrir realmente a la mecánica cuántica y la mecánica estadística, a fin de evitar las tremendas complejidades matemáticas requeridas para un planteamiento absoluto de la teoría cuántica. La línea de mis planteamientos es pragmática bien que axiómática y traté sistemáticamente de explicar todos los temas desde dos puntos de vista, el físico y el matemático. A lo largo de la obra se hace énfasis en los principios fundamentales y no en los detalles técnicos. Además, con mucha frecuencia se recurre al planteamiento de la partícula tal y como se explica en la teoría del transporte del electrón libre; este planteamiento se justifica a la luz de la teoría cuántica que se subraya en el capítulo 8. No se necesita tener conocimientos matemáticos más avanzados que el análisis vectorial y de las ecuaciones diferenciales ordinarias. Aunque en varias ocasiones aparecen las ecuaciones diferenciales parciales y expansiones de la función ortogonal, siempre se proporcionan en seguida los medios matemáticos necesarios para resolverlas. Me es imposible expresar en forma adecuada mi gratitud a todos mis colegas que han contribuido a esta obra. Sin embargo, quisiera dar las gracias de un modo específico a los doctores D.R. Frankl, P.H. Cutler, J. Yahia y H.F. John por sus útiles comentarios, observaciones y sugerencias, así como al Dr. F .G. Brickwedde quien me autorizó a emplear su personal, cuando la transcripción del manuscrito se retrasaba por alguna emergencia. Mis antiguos alumnos, los doctores J.C. Balogh, M W. Cresswell y E.F. Pulver también me ayudaron mucho leyendo, evaluando y corrigiendo partes del manuscrito. También muchos de mis estudiantes me señalaron los errores que hubo en las notas del manuscrito y sugirieron cómo mejorar la exposición de algunos temas. No me puedo acordar de todas las personas que me ayudaron; pero estoy profundamente agradecido a cada una de ellas. También deseo expresar mi gratitud a la señorita Frances Fogle, a la señora Marion Shaw y a la señorita Eileen Berringer por su inapreciable colaboración en la transcripción del manuscrito.

J.P. University Park, Pa.

MCKELVEY

Contenido Capítulo 1 Redes cristalinas y tipos de cristales

13

1.1 1.2 1.3 1.4 1.5

Concepto de estado "sólido", 13 Celdas unitarias y redes de Bravais, 14 Algunas estructuras cristalinas simples, 18 Planos cristalinos e índices de Miller, 23 Espaciamiento de los planos en las redes cristalinas, 25 1.6 Clasificación general de los cristales, 27

Capítulo 2 Análisis cristalográfico con rayos x

31

2.1 Introducción, 31 2.2 Física de la difracción de los rayos X: las ecuaciones de V on Laue, 34 2.3 Factor de dispersión atómica, 37 2.4 Factor geométrico de la estructura, 40 2.5 La red recíproca, 43 2.6 La condición de Bragg en función de la red recíproca, 47

Capítulo 3 Dinámica de las redes cristalinas 3.1 Vibraciones elásticas de medios continuos, 51 3.2 Velocidad de grupo de trenes de ondas armónicas, 53 3.3 Movimiento ondulatorio en redes atómicas unidimensionales, 55 3.4 Estructuras diatómicas unidimensionales, 62 3.5 Región de frecuencia prohibida, 65 3.6 Excitación óptica de vibraciones reticulares en cristales iónicos, 6 7 3. 7 Energía de enlace de estructuras cristalinas iónicas, 69

51

Contenido 8

Capítulo 4 Mecánica cuántica, generalidades

19

4.1 4.2 4.3 4.4 4.5 4.6

Introducción, 79 Radiación del cuerpo negro, 79 Efecto fotoeléctrico, 81 Calor específico de los sólidos, 83 El átomo de Bohr, 84 La hipótesis de De Broglie y las propiedades ondulatorias de la materia, 8 7 4.7 Mecánica ondulatoria, 87 4.8 Dependencia del tiempo de la función de onda, 91 4.9 La partícula libre y el principio de incertidumbre, 94 4.10 Una partícula en un pozo de potencial unidimensional e infinitamente profundo, 100 4.11 Una partícula en un pozo unidimensional de profundidad finita, 103 4.12 El oscilador armónico unidimensional, 111 4.13 Oetogonalidad de las funciones propias y la superposición de estados, 119 4.14 Valores esperados y números cuánticos, 123 4.15 El átomo de hidrógeno, 128 4.16 El espín electrónico, el principio de exclusión de Pauli y el sistema periódico, 141

Capítulo S Mecánica estadística, generalidades 5.1 Introducción, 147 5.2 La función de distribución y la densidad de los estados, 148 5.3 La distribución Maxwell·Boltzmann, 153 5.4 La estadística de Maxwell-Boltzmann para un gas ideal, 161 5.5 Estadística de Fermi-Dirac, 168 5.6 La distribución Bose-Einstein, 176

147

Capítulo 6 Vibraciones reticulares y propiedades térmicas de los cristales 6.1 Cálculos clásicos del calor específico reticular, 181 6.2 Teoría de Einstein sobre el calor específico, 183 6.3 Teoría de Debye sobre el calor específico, 186 6.4 El fonón, 192 6.5 Expansión térmica de los sólidos, 193 6.6 Conductividad térmica reticular de los sólidos, 195

181

Contenido 9

Capítulo 7 Teoría del electrón libre de los metales

203

Introducción, 203 La ecuación de Boltzmann y la trayectoria libre media, 204 Conductividad eléctrica de un gas de electrones libres, 209 Conductividad térmica y efectos termoeléctricos en sistemas de electrones libres, 215 7.5 Procesos de dispersión, 219 7.6 El efecto de Hall y otros efectos galvanomagnéticos, 222 7. 7 Capacidad térmica de sistemas de electrones libres, 225

7.1 7.2 7.3 7.4

Capítulo 8 Teoría cuántica de los electrones en redes periódicas

231

8.1 Introducción, 231 8.2 El teorema de Bloch, 232 8.3 El modelo de Kronig-Penney de un cristal infinito unidimensional, 23 5 8.4 Cantidad de movimiento del cristal y masa efectiva, 240 8.5 Representación de zona reducida; electrones y huecos, 243 8.6 La aproximación del electrón libre, 248 8. 7 La aproximación del enlace firme, 255 8.8 Dinámica del electrón en estructuras bidimensionales y tridimensionales; superficies de energía constante y zonas de Brillouin, 260 8.9 Aisladores, semiconductores y metales, 269 8.10 Densidad de la función de estados y cambios de fase en aleaciones binarias, 273 Capítulo 9 Semiconductores electrónicos uniformes en equilibrio 9.1 Semiconductores, 281 9.2 Semiconductores intrínsecos y semiconductores con impurezas, 284 9.3 Estadística de huecos y electrones- El caso del semiconductor intrínseco, 288 9.4 Energía de ionización de centros de impurezas, 292 9.5 Estadísticas de los semiconductores con impurezas, 295 9.6 El caso de la ionización incompleta de niveles de impureza (Temperatura muy baja), 300 9. 7 Conductividad, 302 9.8 El efecto de Hall y la magnetorresistencia, 306 9.9 Resonancia de ciclotrón y superficies elipsoidales de energía, 316 9.10 Densidad de estados, conductividad y efecto de Hall con superficies complejas de energía, 327 9.11 Mecanismos de dispersión y movilidad de los portadores de carga, 335

281

Contenido 10 Capítulo 1O Exceso de portadores en semiconductores

347

10.1 Introducción, 347 10.2 Comportamiento de transporte de los portadores excedentes; las ecuaciones de continuidad, 348 10.3 Algunas soluciones particulares de la ecuación de continuidad, 361 10.4 Movilidad de arrastre y el experimento de Haynes-Shockley, 371 10.5 Recombinación superficial y condiciones de frontera superficiales, 3 74 10.6 F otoconductividad de estado estacionario, 3 79 10.7 Fotoconductividad transitoria; tiempo de vida de los portadores en excedentes, 383 10.8 Mecanismos de recombinación; la teoría de recombinación de Shockley-Read, 390

Capítulo 11 Tecnología de materiales y medición de propiedades •E volumétricas

401

11.1 Preparación de los materiales semiconductores de alto grado de pureza, 401 11.2 Crecimiento de muestras monocristalinas, 407 11.3 Medición de la resistividad volumétrica, 409 11.4 Medición del contenido de impurezas y la movilidad mediante el efecto de Hall, 411 11.5 Medición del tiempo de vida de los portadores excedentes, 412 11.6 Dislocaciones y otras imperfecciones, 413

Capítulo 12 Teoría de las uniones p-n de los semiconductores 12.1 12.2 12.3 12.4 12.5

421

La unión p-n, 421 El potencial de contacto interno de equilibrio, 424 Potenciales y campos en las cercanías de una unión p-n, 426 Modelo matemático simplificado de la unión p-n abrupta, 429 Capacitancia de unión; determinación del potencial interno, 435

Capítulo 13 Rectificadores de unión p-n y transistores 13.1 Teoría del rectificador de unión p-n, 439 13.2 Corrientes y campos en los rectificadores de unión p-n, 44 7 13.3 Rectificadores de unión de tamaño finito; efectos de superficies y terminales óhmicas, 452 13.4 Mecanismos físicos de ruptura en las uniónes p-n, 456 13.5 Técnicas de fabricación de la unión p-n, 460 13.6 Transistores de unión p-n-p- y n-p-n, 460

439

Contenido 11

Capítulo 14 Uniones p-n a niveles altos de corriente; el rectificara p-i-n,

479

14.1 Uniones p-n a densidades altas de corriente, 479 14.2 El análisis del rectificador p+-i-n+ a niveles altos de corriente, 481 14.3 Rectificadores p-i-u; la caída de voltaje en sentido directo como una función de la temperatura, 490 Capítulo 1S Otros dispositivos semiconductores,

495

15.1 El efecto fotovoltaico p-n y las celdas fotovoltaicas de unión p-n, 495 15.2 Otros dispositivos sensibles a la luz; fototransistores, detectores de partículas y detectores infrarrojos, 502 15.3 Rectificadores controlados p-n-p-n, 503 15.4 Diodos túnel, 506 15.5 Transist~res de efecto de campo o unipolares, 509 CAPITULO 16 CONTACTOS METAL-SEMICONDUCTOR Y SUPERFICIES DE SEMICONDUCTORES, 513 16.1 Contactos metal-semiconductor en equilibrio, 513 16.2 Rectificación por contacto metal-semiconductor, 517 16.3 Estados superficiales y rectificación independiente de las funciones de trabajo, 5 20 16.4 Potencial, campo y carga en la capa superficial de un semiconductor, 524 16.5 Conductividad superficial, efecto de campo y movilidad superficial; propiedades de superficies de semiconductores reales, 5 31 Apéndice a la función & dirac

S3S

Apéndice b análisis tensorial

537

Indice de nombres

541

Indice de temas

S43

CAPITUW

1

Redes cristali,-,m y tipos de cristales 1.1

CONCEPTO DE ESTADO "SOLIDO"

Desde un punto de vista general, el término sólido se aplica a substancias elásticas rígidas, es decir, a substancias que tienen un comportamiento elástico no sólo cuando se les somete a fuerzas hidrostáticas, sino también a esfuerzos de tensión y cortantes. Por supuesto, existen algunos materiales cuyo comportamiento es tanto elástico como plástico o viscoso, de modo que esta clasificación no es del todo rigurosa. No obstante, se adoptará como criterio de lo que es una substancia sólida, reconociendo que existe un tipo de substancias que, al mismo tiempo, se comporta como sólido y como fluido. Los materiales que se pueden considerar como sólidos de acuerdo con esta defmición, se dividen en dos categorías: los amorfos y los cristalinos. Entre las substancias amorfas, los átomos o moléculas pueden estar enlazados con bastante firmeza entre sí; pero poseen poca o ninguna regularidad o periodicidad geométrica, en la forma en que los átomos están dispuestos o acomodados en el espacio. Estas substancias son casi siempre viscoelásticas y se pueden considerar como líquidos sobreenfriados. En la figura 1.1 se muestra una representación bidimensional de un material amorfo.

•o •o •o •o•

•o •o•o •o• •o •o •o •o • •o • o •o •o • •o •o •o •o• •o •o • • • • o • o • oo • oo • • • • • • Cristalino

Figura 1.1.

•o • • o• •o• o • o • • •o • o o • o • o • o •o•• • •o o o • •o • o• o o • •o • • • o • o o o •o • • • • • • Amorfo

Representación esquemática en dos dimensiones, que muestra la düerencia existente entre el arreglo atómico de un sólido cristalino y otro amorfo.

13

14 H.edes cristalinos y tipos de cristales Por otro lado, las substancias cristalinas se caracterizan por una periodicidad perfecta (o casi perfecta) en su estructura atómica; esta regularidad de estructura proporciona un cuadro conceptual muy simple de un cristal y facilita la tarea de comprender y calcular sus propiedades físicas. Por esta razón, los sólidos cristalinos se comprenden mejor físicamente que los sólidos y líquidos amorfos. En este libro, el tema se restringirá principalmente a un estudio de las propiedades físicas de los sólidos cristalinos perfectos o casi perfectos. En algunas ocasiones, la presencia de un número relativamente pequeño de imperfecciones tales como átomos de impurezas, vacíos en la red o dislocaciones, en un cristal periódico que sería perfecto a no ser por esta circunstancia, puede producir cambios notables en el comportamiento físico del material. Esta obra se ocupará también de ellos según la importancia que revistan dichos efectos. Por último, es necesario comprender que las muestras macroscópicas de sólidos cristalinos tales como metales, cerámicas, sales iónicas, etc., no siempre se componen de un solo cristal, sino que a menudo están formados por un conjunto o conglomerado de pequeñas unidades de cristal -cada una con diferente orientación de cristal- separadas entre sí por "fronteras o límites de grano" que se pueden considerar como regiones definidas de rupturas y dislocaciones reticulares muy grandes. Principalmente se tratarán las propiedades de diferentes tipos de cristales individuales; pero se intentará comprender la naturaleza de las fronteras o límites de granos y sei'ialar las principales formas en que pueden influir en las propiedades físicas de las muestras cristalinas macroscópicas.

1.2 CELDAS UNITARIAS Y REDES DE BRAVAIS

En la figura 1.2 se describe la estructura reticular de un cristal bidimensional que se utilizará como ejemplo para explicar ciertos términos cristalográficos fundamentales. En relación con esta figura, se puede seleccionar el paralelogramo ABCD como una celda unitaria de dicha estructura reticular o red, la cual está determinada por los vectores base a y b. Todas las traslaciones del paralelogramo ABCD mediante múltiplos enteros de los vectores a y b a lo largo de las direcciones a y b, darán como resultado su traslación a una región del cristal exactamente igual a la original. Así pues, todo el cristal se puede reproducir sencillamente si se reproduce la super-

Figura 1.2.

Celdas unitarias y vectores base en una estructura reticular bidimensional.

Celdas unittuios y redes de Bravais

15

ficie ABCD que se traslada sobre las direcciones a y b mediante todas las combinaciones posibles de múltiplos de los vectores base a y b. En otras palabras, cada punto de la red del cristal se puede describir por medio de un vector r tal que

r =ha+ kb,

(1.2-1)

en donde h y k son enteros. Evidentemente, este procedimiento se puede ampliar con suma facilidad para determinar celdas unitarias y vectores base en redes cristalinas tridimensionales. Por tanto, se puede llegar a las siguientes defmiciones:

Celda unitaria: una región del cristal defmida por tres vectores, a, b y e, que al trasladarse por medio de cualquier múltiplo entero de dichos vectores reproduce una región similar del cristal, Vectores base: conjunto de vectores linealmente independientes a, b, e, que se pueden usar para defmir una celda unitaria, Celda unitaria primitiva: la celda unitaria más pequeiia (en volumen) que se puede defmir para una red dada, Vectores base primitivos: conjunto de vectores linea1mente independientes que definen una celda unitaria primitiva. De acuerdo con las anteriores defmiciones, en este caso también es evidente que cada punto reticular de una red cristalina tridimensional se puede describir mediante un vector de la forma

r =ha+ kb +le

(h, k, 1 enteros)

(1.2-2)

Conviene obserYar que la celda unitaria se puede defmir de varias maneras, po1 ejemplo, A'B'C 'D' y A"B''C "D" son otras posibilidades que describen la celda uni· taria ilustrada en la figura 1.2. Estas tres celdas unitarias son de tipo primitivo para esta red y, por ende, existe una ambigüedad correspondiente en la selección de un conjunto de vectores base primitivos. Cualquiera de los vectores (a, b) o (a', b') podría servir de igual manera. La celda de mayor tamaño EFGH de la misma figura es un ejemplo de una celda unitaria que no es primitiva. Se puede demostrar que existen 14 formas de acomodar los puntos en las redes cristalinas, de tal modo que todos los puntos de dichas redes tengan exactamente el mismo medio circundante. Estas estructuras reticulares conocidas como redes de Bravais se ilustran en la figura 1.3. En el caso de una de estas redes, un observador que ve el cristal desde uno de los puntos de la red, vería exactamente la misma disposición o arreglo de los puntos circundantes de la red, sea cual fuere el punto que haya seleccionado para observar. A primera vista podría parecer que puede existir otra red de Bravais; por ejemplo, en las 14 redes de Bravais de la figura 1.3 no se incluye un arreglo tetragonal centrado en la cara. la razón de ello es que esta estructura tetragonal centrada en la cara equivale a una red tetragonal centrada en el cuerpo, en la que el lado de la base de la celda unitaria es 1/.¡2 veces su valor correspondiente a la disposición centrada en la cara. La demostración de este postulado, y la pregunta acerca de por qué las estructuras cúbicas centrada en la cara y centrada en el cuerpo son distintas, se le dejan al lector como ejercicio. Estas 14 redes se pueden agrupar en siete sistemas cristalinos, cada uno de los cuales tiene en común ciertos elementos de simetría característicos. Los elementos de simetría que se han escogido para especificar estos siete sistemas son los siguientes:

16 Redes cristoliliiiS y tipos de cristales

/

/

/

V Cúbica simple

Cúbica centrada en la base

./

7

./

[7

Tetragonal centrada en el cuerpo

Tetragonal simple

V

Cúbica centrada en la cara

V

Ortorrómbica simple

Ortorrómbica Ortorrómbica Ortorrómbica centrada en la base centrada en el cuerpo centrada en la cara

MonocHnica Monoclínica simple centrada en la base

Triclínica

Trigonal

e

Figura 1.3.

Las catorce redes de Bravais.

(1) Eje de rotación de orden n: la rotación alrededor de un eje de este tipo a un ángulo de 21rjn radianes no produce ningún cambio en la estructura reticular. En este caso, n puede tener los valores 1, 2, 3, 4 y 6. La simetría rotacional de 5 veces en una red cristalina es imposible. (2) Plano de simetría: una mitad del cristal reflejada en un plano semejante que pasa por un punto de la red, reproduce la otra mitad.

Celdas unitarias y redes de Bravais

17

(3) Centro de inversión: un punto de la red alrededor del cual la operación r-+ - r (en donde r es un vector a cualquier otro punto de la red) deja a la estructura reticular sin sufrir cambio alguno. ( 4) Eje de rotación-inversión: la rotación alrededor de este eje a 2n/n radianes (n = 1, 2, 3, 4, 6) seguida de una inversión alrededor de un punto de la red por el que pasa el eje de rotación, no produce ningún cambio en la red. Existen otras formas posibles de operaciones de simetría; pero se puede demostrar que todas son equivalentes a combinaciones lineales de estas cuatro. Los siete sistemas cristalinos con sus elementos de simetría representativos y sus características de celda unitaria aparecen en la tabla 1.1. En la figura 1.4 se describe la notación que se emplea para las dimensiones y los ángulos de la celda unitaria.

TABLA l.l Los siete sistemas cristalinos

Sistema

Elemento característico de simetría*

Red de Bravais

Triclínico

Ninguno

Simple

Monoclínico

Un eje de rotación doble

Simple Centrada en la base

Características de la celda unitaria

a=l=b=l=c a. =

f3 =

90° =1= y

Ortorrómbico

Tres ejes de rotación doble mutuamente perpendiculares

Simple Centrada en la base Centrada en el cuerpo Centrada en la cara

a=l=b=l=c a. = f3 = y = 900

Tetragonal

Un eje de rotación cuádruple o un eje de rotación-inversión cuádruple

Simple Centrada en el cuerpo

a=b=l=c a. = f3 = y = 900

Cúbico

Cuatro ejes de rotación triple (diagonales cúbicas)

Simple Centrada en el cuerpo Centrada en la cara

a=b=c a. = f3 = y =

Un eje de rotación séxtuple

Simple

a =b

Hexagonal

=1=

90°

e

a.= 120° f3 =y= 90°

Trigonal (Rombohédrico)

Un eje de rotación triple

Simple

a=b=c a. =

f3 =

Y

-r 90·

*Por supuesto, pueden existir otras propiedades de simetría en casos individuales. aquí se indican sólo los más peculiares de cada sistema cristalino en particular.

18 Redes cristalinas y tipos de cristales

b

~------b--------~

Figura 1.4.

Notación de los ángulos y las dimensiones dentro de la celda unitaria.

Conviene recordar que, por lo general, los puntos de la red de una estructura reticular no representan a un solo átomo, sino más bien a un grupo de átomos o molécula. En consecuencia, además de las propiedades de simetría de los puntos reticulares propiamente dichos, se necesita tomar en cuenta las propiedades de simetría de las moléculas o grupos de átomos en cada punto reticular alrededor de los puntos de red propiamente dichos, a fin de enumerar totalmente todas las estructuras cristalinas posibles. Cuando esto se hace, se descubre que hay 230 patrones repetitivos básicamente diferentes en los que los elementos se pueden acomodar para formar posibles estructuras cristalinas. Las limitaciones de este libro no permiten estudiar y enumerar todas estas posibilidades en detalle. Si el lector desea obtener datos más detallados sobre este tema, convendrá que consulte una de las obras que tratan sobre cristalografía y que se citan al final de este capítulo.

1.3

ALGUNAS ESTRUCTURAS CRIST AUNAS SIMPLES

De acuerdo con la figura 1.3, es evidente que existen tres redes cúbicas posibles, es decir, la cúbica simple, la cúbica centrada en el cuerpo y la cúbica centrada en la cara. La celda cúbica unitaria que se ilustra en la figura 1.3 como la red cúbica simple, constituye también la celda unitaria primitiva, dado que contiene el mínimo irreductible de un átomo por cada celda. Este resultado se obtiene observando que en la celda cúbica simple se tienen ocho átomos en los ocho vértices de la celda, donde, cada átomo es compartido en la misma forma por ocho celdas unitarias adyacentes a cada vértice. Por tanto, se puede decir que se tienen 8 átomos en las esquinas y que 1/8 de cada uno de éstos pertenece a esta celda en particular, dando un total de un átomo por celda unitaria. La celda cúbica correspondiente a la estructura cúbica centrada en la cara, contiene 8 átomos en los vértices, compartidos por 8 celdas y 6 átomos centrados en la cara, que son compartidos por dos celdas, lo cual da un total de 8(1/8) + 6(1/2), o bien, 4 átomos dentro de la celda cúbica. En la celda cúbica correspondiente a la estructura cúbica centrada en el cuerpo, se tienen 8 átomos en los vértices compartidos por 8 celdas y un átomo central que pertenece exclusivamente a dicha celda, dando un total de 8(1/8) + 1 ó 2 átomos dentro de la celda cúbica. Para estructuras simples que contienen átomos de un solo tipo, la celda unitaria primitiva contiene casi siempre un solo átomo y, por tanto, se puede llegar a la conclusión de que la celda cúbica centrada en la cara y la centrada en el cunpo no son primitivas. En efecto, este es el caso; las celdas primitivas para las estructm:J<; cúhica crntrada en la cara y cúbica centrada en el cuerpo, se ilustran

Algunas estructuras cristalinas simples

19

Celda primitiva cúbica centrada en la cara

Celda primitiva cúbica centrada en el cuerpo

1 1

1

1 1

1

1 11 ~--------4'

1

1

Figura 1.5.

Celdas unitaria~ primitivas de redes cúbicas centrada en la cara y centrada en el cuerpo.

en la figura l.S. Cada celda primitiva contiene un solo átomo. Como siempre, estas celdas primitivas no son las únicas que se pueden definir, ya que existen muchas opciones posibles de grupos de vectores base primitivos para cualquiera de las estructuras. La celda primitiva para la estructura cúbica centrada en la cara que se ilustra en la figura 1.5 es, obviamente, un caso especial de una estructura trigonal en la que a = {3 = 'Y = 60°. Para este valor particular de a, la estructura trigonal posee una simetría cúbica y se reduce a la red cúbica centrada en la cara. Por supuesto, se puede hacer caso omiso de la celda cúbica de la red cúbica centrada en la cara y considerar que la estructura sea de tipo trigonal con a = 60°, empleando sólo la celda primitiva de la figura l.S. Sin embargo, casi siempre conviene considerar la mayor celda cúbica como la base del cristal, en lugar de utilizar la celda primitiva, ya que esto permite representar la estructura reticular en un sistema de coordenadas ortogonales (x, y, z) -el cual es mucho más simple que un sistema oblicuo- y porque la red tiene todas las propiedades de simetría relacionadas con la estructura cúbica simple. En el caso de la estructura cúbica centrada en el cuerpo, por similares consideraciones, se aconseja usar, siempre que sP.a posible, la mayor celda cúbica como la base del cristal. No obstante, para ciertos fines será absolutamente necesario emplear la celda primitiva; pero estos casos especiales se señalarán cuando surjan. Cuando se tienen esferas iguales dentro de un recipiente, el empaquetamiento más cerrado o compacto que se puede lograr es tener una capa en la base en la que cada esfera está rodeada por otras seis adyacentes, con capas exactamente iguales encima de ella, utilizando los intersticios triangulares entre las esferas de la capa inferior para acomodar las que se van agregando en la capa inmediatamente superior. Es obvio que en un arreglo de empaquetamiento compacto cada esfera sólo tiene 12 vecinas adyacentes, seis que la rodean en la misma capa, 3 en la superior y. 3 en la inferior. Cualquier estructura que tiene un empaquetamiento compacto en este sentido, se caracteriza por la propiedad de que cada átomo tiene 12 vecinos adyacentes y, por lo contrario, no hay otra estructura en la que cada átomo tenga más de 12 vecinos cercanos.

20

Redes cristalinos y tipos de cristales

@ Posiciones para la tercera capa en h.e.c. Posiciones para la tercera capa c.c.c. de empaquetamiento en cúbica centrada en la cara compacto

©

A

A

A

Figura ] .6.

Arre~( o de capas de empaquetamiento compacto en las redes cúbica centrada en la eara con empaquct~miento compacto y la hexagonal con empaquetamiento comp;wto. [Tomado l"Oil autorización de L. V. Azaroff, Introduction to Solids, McC.raw-Hill (1960), pá¡>;ina 1)0.1

Algunas estructuras cristalinas simples

21

Para tener una estructura con esta clase de empaquetamiento compacto, se puede colocar una capa inferior A, luego una segunda capa B -tal como se describió en el párrafo anterior-, después se pone una tercera capa en la que los átomos quedan directamente arriba de los de la capa A, a continuación, la cuarta capa cuyos átomos se ubican directamente arriba de los de la capa B, y así sucesivamente hasta formar un arreglo de capas ABABABAB ... , como se ilustra en la figura 1.6. Esta estructura tiene una Simetría hexagonal y se le conoce con el nombre de estructura hexagonal de empaquetamiento compacto (h.e.c.). De igual modo, se pueden colocar los átomos de la tercera capa ya no directamente encima de los de la primera, sino en una tercera gama de posiciones como se ilustra en la figura 1.6, formando la tercera capa C cuyos átomos quedan arriba, en una posición diferente a los de las capas A y B. A continuación se agrega la cuarta capa en las posiciones correspondientes a la capa A y se forma una disposición de capas ABCABCABC ... Esta segunda estructura ·posible de empaquetamiento compacto es sencillamente, la cúbica centrada en la cara, que es la normal en las capas de empaquetamiento compacto de la estructura diagonal cúbica. De acuerdo con la figura 1.3, se puede ver claramente que cada átomo de la estructura cúbica centrada en la cara tiene sólo 12 vecinos contiguos, a una distancia de ..j2(2 veces el lado del cubo, por lo que la estructura debe ser de empaquetamiento compacto. Por el contrario, en la estructura cúbica centrada en el cuerpo, cada átomo tiene sólo 8 vecinos adyacentes a una distancia de ../'f/2 veces el lado del cubo; si los puntos reticulares de la estructura cúbica centrada en el cuerpo se observaran como si fueran esferas en expansión, éstas tocarían el borde del cubo antes de rozar la diagonal y la estructura resultante no tendría un empaquetamiento tan compacto. En la figura l. 7 se muestran las estructuras de NaCl y CsCI. La estructura del NaCI tiene átomos alternantes de Na y Cl en los puntos reticulares de una red cúbica simple. Los átomos de Na quedan en los puntos reticulares de una estructura cúbica centrada en la cara, al igual que los átomos de Cl. La estructura del CsCl es básicamente centrada en el cuerpo y, en ella, los átomos de Cs quedan en las posiciones centradas en el cuerpo y los de Cl en los vértices del cubo (o viceversa). Hay un gran número de cristales iónicos que cristalizan en cualquiera de estas dos formas reticulares. /

/

L

~

V

/ ~

V

/ /

V V

V V

V

V (O) NoCI

Figura 1.7.

V

V (b) CsCI

Las estructuras de NaCI y CsCI.

En la figura 1.8 se ilustran las estructuras del diamante y la zincblenda. Las líneas que conectan los átomos de estas estructuras representan los enlaces covalentes de los pares de electrones que están dispuestos tctrahédricamente alrededor de cada átomo. En estas dos estructuras, cada átomo tiene cuatro vecinos contiguos. En el caso del diamante, la estructura se puede considerar como dos redes cúbicas centra· das en la cara que se intercalan una en la otra, desplazándose entre sí a lo largo de la diagonal del cubo en 1/4 de la longitud de dicha diagonal. Por tanto, la re.d tiene

22

Redes cristaliTUlS y tipos de cristales

{al

Zincblenda

{ZnS)

Figura 1.8.

Figura 1.9.

{ b)

Diamante

Estructuras de la zincblenda y el diamante.

Diagrama de la estructura reticular de la zincblenda en donde se muestran los contornos lk la n:lcla unitaria cúbica.

Planos cristalinos e índices de Miller

23

una simetría cúbica. La descripción anterior de la red del diamante se puede entender mejor estudiando la figura 1.9 en donde se muestra cómo la red del diamante se puede describir mediante una celda unitaria cúbica. El silicio, el germanio y el estaño a- (gris) se cristalizan también en la estructura del diamante. La estructura de la zincblenda está íntimamente relacionada con la del diamante. En el caso de la zmcblenda, la estructura se puede representar como dos redes cúbicas centradas en la cara que tienen una interpenetración, al igual que el diamante, excepto que una de las redes cúbicas centradas en la cara se compone por completo de átomos de zinc y la obra está constituida totalmente por átomos de S. Por supuesto, esta estructura reticular también tiene simetría cúbica. Los compuestos semiconductores III-V, InSb, GaAs, GaSb, InP, GaP, etc., se cristalizan con esta misma estructura. Lo "compacto" del empaquetamiento de los átomos en cualquier estructura dada se puede inferir del número de vecinos más cercanos que rodean a cada átomo. Esta cifra, que con frecuencia se denomina número de coordinación del cristal, puede variar de un máximo de 12 en las estructuras de empaquetamiento compacto hasta el 4, en el caso del diamante y la zincblenda, cuyas estructuras son relativamente "abiertas".

1.4

PLANOS CRISTALINOS E INDICES DE MILLER

En un cristal de red periódica regular, con frecuencia es necesario mencionar el sistema de planos dentro del cristal que corren en ciertas direcciones, cortando varios conjuntos de átomos. Así pues, las capas con empaquetamiento compacto de las redes cúbicas centradas en la cara y hexagonal con empaquetamiento compacto, forman sistemas muy definidos e importantes de planos cristalinos. La orientación de estos sistemas de planos dentro del cristal se especifica mediante tres números denominados índices de Miller, que se pueden determinar como sigue:

(1) Se toma como origen cualquier átomo del cristal y se levantan ejes de coordenadas a partir de dicho átomo en las direcciones de los vectores base. (2) Se encuentran las intersecciones de un plano que pertenece al sistema, expresándolos como múltiplos enteros de los vectores base a lo largo de los ejes cristalinos. (3) Se sacan los recíprocos de estos números y se reducen a la tríada más pequeña de enteros h, k, l, que tienen la misma relación. De donde, la cantidad (hk/) constituye lol> índices de Miller de dicho sistema de planos. Por ejemplo, en la figura 1.1 O se muestra un plano cuyas intersecciones son el doble de la distancia reticular a, tres veces la distancia reticular b y 4 veces la distancia reticular c. Los índices de Miller de la familia a la que pertenece este plano se obtienen sacando los recíprocos de estos números, es decir, 1/2, 1/3, 1/4, y reduciéndolos a la tríada más pequeña posible de enteros que tengan la misma relación. Esto se logra multiplicando cada uno de los recíprocos p0r doce, que en este caso dan 6, 4, 3. Los índices de Miller se escriben simplemente encerrando estos tres números entre paréntesis; en este ejemplo, el plano forma parte de una familia de planos (643) o sea, un plano. Puede haber un número de sistemas de planos cuyos índices de Miller difieran por permutación de los números o de signos menos y, sin embargo, ser todos cristalográficantente equivalentes en lo que respecta a densidad de átomos y espa-

24 Redes cristalinas y tipos de cristales

Figura 1.10.

Un plano reticular (643) de una red cristalina.

ciamiento interplanar. Por ejemplo, en una red ortogonal, los siguientes planos (Jzkl), (hkl), (hKl), (hkl), (ftld), (fikl), etc., obtenidos al asignar varias combinaciones de signos menos a los índices de Miller, son equivalentes en este sentido. (Se acostumbra escribir los signos menos encima y no antes de los índices de Miller.) De igual modo, en una estructura reticular cúbica, todos los planos representados por permutaciones de los tres índices de Miller entre sí mismos, tales como (hkl), (khl), (lhk), etcétera, al igual que los que se obtienen tomando varias combinaciones de signos menos, son cristalográficamente equivalentes. C'uando se hace referencia a un grupo completo de planos cristalográficamente equivall'ntes, de los cuales (hkl) ~s un miembro, se acostumbra encerrar los índices de Miller entre llaves, o sea, { hkl}. Si el plano es paralelo a uno o dos de Jos vectores a, b, e, una o dos de las intersecciones se localizarán en el infinito; los índices de Miller correspondientes son, por tanto. cero. Por ejemplo, si el plano que se ilustra en la figura 1.1 O se hace girar alrededor de la línea AB hasta que queda paralelo a e, las intersecciones se convierten en 2, 3, oo, y los índices de Miller son, en consecuencia (320). Si se hace girar más todavía alrededor de una línea perpendicular al plano a y b pasando por el punto A hasta que quede en paralelo a b, las intersecciones serán 2, oo, uo, y los índices de Miller son (1 00). El lector debe conocer a fondo las familias de planos { 100} (planos de cara cúbica), { 11 O } y de {111} para las redes cúbicas. Los índices de una dirección dentro de un cri~tal se pueden expresar como un conjunto de enteros que tienen la misma relación que los componentes de un vector en esa dirección, expresados como múltiplos de los vectores base a, b, c. Por tanto, el índice de dirección de un vector ha+ kb +le es, en todo caso, [hkl]. Los paréntesis cuadrados que encierran las tres cifras señalan los tres índices de dirección. Por supuesto, las direcciones con distintos índices direccionales pueden ser cristalográficamente diferentes en la misma forma que los planos cristalinos con distintos índices de Miller; sobre todo las normales a los planos cristalográficamente equivalentes también deben tener direcciones cristalográficamente equivalentes. El conjunto completo de direcciones cristalográficamente equivalentes de las cuales [hkll es un miembro, se expresa encerrando los índices de dirección en la siguiente forma: (hk[). En cristales cúbicos, una dirección con índices direccionales [hkl] es normal a un plano cuyos índices de Miller son (hkl); pero, por lo general, esto no se aplica a otros sistemas. Esta es otra de las razones aceptables para relacionar las redes cúbicas centradas en el cuerpo y la centrada en la cara con estructuras cúbicas más que con celdas unitarias primitivas. El comprobar este resultado queda como ejercicio para el lector. La posición de los puntos de una celda unitaria se especifica en función de las partes fraccionales de las magn1tudes de los vectores de base a lo largu de las direcciOne~ de coordenadas correspondientes, tomando siempre como origen el átomo

Espaciamiento de los planos en las redes cristalinas

25

de un vértice. Por ejemplo, las coordenadas del punto central de una celda unitaria son {1/2, 1/2, 1/2) y las coordenadas de los centros de las caras son (1/2, 1/2, 0), (0, 1/2, 1/2), (1/2, O, 1/2), (1/2, 1/2, 1), (1, 1/2, 1/2) y (1/2, 1, 1/2).

1.5

ESPACIAMIENTO DE LOS PLANOS EN LAS REDES CRISTALINAS

De acuerdo con la figura 1.1 O, se podría pensar que el espaciamiento existente entre los planos vecinos del sistema (hkl) sería simplemente igual a la longitud de la normal al plano definida por las intersecciones dadas y el origen. Sin embargo, generalmente no es así y la razón es que al determinar la ubicación de un plano (hkl) desde ciertas distancias de intersección, el origen se podría tomar como cualquier punto reticular del cristal, por lo que un plano (hkl) debe pasar por cada punto reticular del cristal. Esto se ilustra gráficamente en la figura 1.11 para el caso de un conjunto de "planos" en una estructura reticular bidimensional. El sistema de planos es el que determinan las intersecciones 3a y 2b a lo largo de los ejes, a y b, respectivamente. En consecuencia, los índices de Miller son (23) (o bien, (230) si se piensa que los planos son paralelos a un eje e que sale del plano de la hoja de papel en un cristal tridimensional). Los planos que están delineados con líneas más gruesas son los que se determinan por medio de las distancias de intersección (3a, 2b) y el origen se escoge en O. No obstante, el origen podría haberse escogido en el punto reticular número "1 ", en cuyo caso se habrían definido los planos de trazo más ligero marcados con "1 ", utilizando el mismo conjunto de distancias de intersección. De igual manera, el origen se podría haber ubicado en los puntos reticulares 2, 3, 4 ó 5, en cuyo caso, usando todavía el mismo conjunto de distancias de intersección, el conjunto de planos números 2, 3, 4 y 5 habrían quedado definidos. Sin embargo, ahora se tiene un plano de esta familia que pasa por cada átomo del cristal, entre

Figura I.l L

Una representación de todas las líneas (23) dentro de una red bidimensional. Si existe un eie e- normal al nlano del papel, este sistema de líneas se puede considerar como los tra10s de planos (230) (que son normales a la página) en el plano del papel. Observe que sólo se tiene una línea (o plano) del sistema que pasa pnr cada punto reticular.

26 Redes cristalinos y tipos de cristales los cuales se intercalan 5 planos adicionales entre cada par de planos originales de trazo grueso. Ahora se ve que las intersecciones de los planos adyacentes a lo largo de los ejes a y b difieren, respectivamente, en a/2 y b/3. Para un .conjunto de índices de Miller (hk) estas intersecciones diferirán en a/h y b/k. Para demostrarlo, véase primero el área OA CB de la figura 1.11. Se tienen los puntos reticulares hk que pertenecen a esta área, ya que consiste en hk celdas unitarias que tienen cada una de ellas un solo punto reticular. La región ABCD, que obviamente equivale en superficie a OACB (ambas se pueden tomar como superposiciones de dos triángulos congruentes a OAB) por tanto, también tiene hk puntos reticulares. Esta superficie también contiene sólo hk planos reticulares (6 en el ejemplo anterior), uno por cada uno de los puntos reticulares hk dentro del área. Se observará que cada plano puede cortar sólo un punto reticular dentro de ABCD, excepción hecha de los planos que cortan los puntos reticulares de las fronteras, que pueden pasar por dos puntos reticulares, de los cuales un medio o un cuarto pueden pertenecer a ABCD, dependiendo de que dichos puntos reticulares así intersecados representen átomos laterales o de vértices. En consecuencia, en ABCD hay hk planos del sistema que se intersecan con el eje b dentro de una distancia hb, siendo la diferencia que hay entre las intersecciones b de los planos adyacentes, hb/hk = b/k. De la misma manera, en el área ABEC que también es igual en superficie a OACB y que contiene también hk puntos reticulares y hk planos, se observa que se tienen hk que cortan el eje a en una distancia ka, en donde la diferencia existente entre las intersecciones a de los planos adyacentes del sistema es afh. Para simplificar los conceptos geométricos, este resultado se obtuvo para un cristal bidimensional (o para planos paralelos al eje e de un cristal tridimensional). Sin embargo este mismo argumento se puede ampliar en una forma muy directa para un conjunto de planos (hk{) de un cristal tridimensional teniendo como resultado el hecho de que las distancias entre las intersecciones entre los ejes y los planos adyacentes de un sistema con índices de Miller (hkl) a lo largo de los ejes a-, b- y e- son, respectivamente, afh, b/k y cfl. El desarrollo de la exposición para un cristal tridimensional queda de ejercicio para que el lector lo resuelva. El espaciamiento real d que hay entre los planos adyacentes se puede calcular tomando cualquier punto reticular como origen, levantando ejes en las direcciones

b

k

Figura 1.12.

Angulas direccionales de la normal al plano (hkl).

Qasificación general de

~os

cristales

27

a-, b- y e-, y encontrando la distancia perpendicular existente· entre este origen y el plano cuyas intersecciones con el eje son afh, b/k y cfl. En relación con la figura 1.12, es obvio que d = OP =

a

e

b

h cos rx = k cos fJ = l cos y,

(1.5-1)

en donde a, {3, 'Y son los ángulos que hay entre la nonnal al plano y los ejes a-, bY e-, respectivamente. No obstante, si n es el vector unitario nonnal al plano, se tiene que n • a =a cosa, etc., y

n·a

n·b

n·c

(1.5-2)

d=-=-=h k l .

En una red ortogonal, tomando el eje de la coordenada x a lo largo de a, el eje y sobre b y el eje z sobre e, la ecuación del plano (hkl) cuyas intersecciones con los ejes son a/h, b/k, cfl, es

hx

f(x,y,z)

ky

lz

=-; + b +e =

l.

(1.5-3)

Si f(x, y, z) =constante es la ecuación de una superficie, entonces Vf es un vector nonnal a dicha superficie y la unidad nonnal n está dada por

(hfa)i"

Vf

0 =

+ (k/b)i, + (lfc)iz

\-Vf-1 = "'--"-........;;;J'":-h-2..;. . .;. . . ;k2-<--l....:.2.;.....;....=.,

(1.5-4)

2+b2+2 a e

y el espaciamiento d'que hay entre los planos adyacentes (hkl) es simplemente

n·a

d= -

h

=

1 Jh2 k2 [2 2+b2+2 a e

,

(1.5-5)

de acuerdo con (1.5-2). En este punto conviene observar que a, b y e no son vectores unitarios, en este ejemplo, a = aix, b = biy y e = ciz, en donde ix, iy e iz son la tríada usual de vectores unitarios a lo largo de las direcciones x-, y- y z-, respectivamente. En estructuras reticulares no ortogonales, el problema de encontrar el espaciamiento existente entre planos adyacentes en ténninos explícitos de los espaciamientos y los ángulos reticulares se hace más complejo y no se estudiará en esta obra, aunque las expresiones generales (1.5-1) y (1.5-2) son correctas tanto para sistemas ortogonales como para los no ortogonales.

1.6

CLASIFICACION GENERAL DE LOS CRISTALES

Para darle al lector una imagen inicial amplia de las propiedades y las características de varios tipos de materiah:s cristalinos, se hará un repaso breve de algunas de las características más sobresalientes de varias clases de cristales. Por supuesto, se pueden

28 Redes cristalinas y tipos de cristales clasificar en muchas formas, por ejemplo, según sus redes cristalinas, propiedades eléctricas, propiedades mecánicas o características químicas. Sin embargo, para el estudio que nos ocupa, es más conveniente adoptar un esquema de clasificación basado en el tipo de interacción que hace que los átomos del cristal se mantengan unidos. De acuerdo con este esquema de clasificación, los sólidos se subdividen en cuatro categorías generales: iónicos, covalentes, metálicos y moleculares. Cada una de estas clases se examinará en lo particular, aunque se reconoce que no son absolutamente distintos y que algunos cristales pueden posser, al mismo tiempo, características relacionadas con más de una de estas clases generales. Los iónicos son cristales en los que los electrones de valencia se transfieren de un átomo a otro, dando como resultado que el cristal esté compuesto de iones positivos y negativos. La fuente de energía cohesiva que mantiene unido al cristal es la intersección electrostática de estos iones. La configuración electrónica de los iones es esencialmente la de un gas inerte, en donde la distribución de carga de cada ion es esféricamente simétrica. Los compuestos químicos que contienen átomos muy electropositivos y electronegativos, por ejemplo, NaCl, KBr, LiF, tienden a formar cristales iónicos en estado sólido. Casi siempre los cristales iónicos tienen energías de enlace relativamente altas y, como resultado, se caracterizan por puntos de fusión y ebullición más o menos elevado. También se caracterizan por ser malos conductores eléctricos a temperaturas normales y casi siempre son transparentes a la luz visible en tanto que muestran un solo pico de reflexión óptico característico en la región lejana infrarroja del espectro. Los cristales son a menudo muy solubles en disolventes ionizantes tales como el agua, y sus soluciones se disocian fácilmente en iones libres. Casi siempre los cristales iónicos se cristalizan en estructuras de empaquetamiento relativamente compacto como las del NaCl y el CsCI. Los cristales covalentes son aquellos en los que varios átomos comparten equitativamente los electrones de valencia en lugar de transferirlos de unos a otros, como sucede en los cristales iónicos. De donde, no se tiene una carga neta asociada con ningún átomo del cristal. A menudo los elementos de las columnas III, IV y V de la tabla periódica forman combinaciones covalentes. Un ejemplo típico de cristal cavalente lo tenemos en el diamante, en el que cada átomo de carbono comparte sus cuatro electrones de valencia con sus cuatro vecinos más cercanos formando enlaces covalentes de pares de electrones. Los espins de los electrones de estos enlaces de par de electrones son antiparalelos. Estos enlaces covalentes de pares de electrones del diamante son idénticos a las uniones carbono-carbono que se encuentran tan frecuentemente en los compuestos orgánicos. Tienen una naturaleza muy direccional, es decir, los electrones tienden a concentrarse a lo largo de las líneas que unen a los átomos adyacentes y estas líneas tienden a ubicarse tetrahédricamente alrededor de cualquier átomo. Esta disposición tetrahédrica natural de los enlaces covalentes se satisface en las estructuras del diamante y la zincblenda y se ha descubierto que los cristales covalentes tienen a menudo estas estructuras. Por lo general, los cristales covalentes son materiales duros, quebradizos y de energías de enlace bastante elevadas, con puntos de fusión y ebullición elevados. Son semiconductores típicos cuya conductividad eléctrica es muy sensible a la presencia de pequeñas cantidades de átomos de impurezas y aumenta al incrementarse la temperatura a niveles lo suficientemente elevados. Son transparentes a la radiación de longitudes de onda largas y opacos a longitudes de onda más cortas, con una transición abrupta que se produce a una longitud de onda característica y que casi siempre se localiza en la región visible o infrarroja cercana. Existe un rango continuo entre las propiedades covalente e iónica; un cristal dado puede tener naturaleza tanto covalente como iónica y sus electrones de valencia se transfieren en parte y se comparten parcialmente. En la tabla 1.2, los cmtales de la primera columna se componen de átomos de la columna IV del

Dosificación general de los cristales

29

TABLA 1.2. Cristales covalentes y iónicos

Covalentes (Grupo IV)

e (diamante) SI

Ge

cx-Sn

Compuestos III-V

Compuestos 11-VI

Compuestos {iónicos) I-VII

BN BP AIN AIP GaP AlAs

BeO BeS MgO MgS CaO Ca S ZnS CaSe ZnSe CdS CdSe ZnTe CdTe

LiF LiCI NaF NaCI KF KCI LiBr KBr Nal RbCI RbBr KF Rbl CsBr

GaAs InP AISb GaSb InAs InSb

sistema periódico y forman cristales completamente covalentes. Los compuestos de la cuarta columna de la tabla son de '"I y VII" y están constituidos de átomos muy electropositivos y electronegativos y los cristales de estos compuestos son muy iónicos. La segunda y la tercera columnas contienen compuestos (II-Vl y lll-V) que son intermedios entre estos dos extremos y tienen naturaleza tanto iónica como cavalente. Por supuesto, los compuestos 111-V son un poco más covalentes que los compuestos 11-VI. Los compuestos intermetálicos III-V forman, a pesar de su carácter ligeramente iónico, una serie de semiconductores cuyas propiedades son similares en muchas formas a las de Jos materiales correspondientes del grupo IV. Los elementos metálicos en estado libre forman cristales metálicos en los que están presentes electrones libres. El hecho de que haya tales electrones libres explica la elevada conductividad eléctrica y térmica de los metales. A su vez, a esta elevada conductividad eléctrica se deben directamente los elevados coeficientes de reflexión y absorción ópticas que son las propiedades ópticas más típicas de los metales. Las propiedades eléctricas y térmicas de los metales que se deben a la existencia de los electrones libres, se pueden explicar fácilmente si se supone que el cristal metálico es un recipiente lleno de un "gas ideal de electrones libres". La energía de enlace de metales "ideales" tales como los metales alcalinos, se originan en la interacción del gas de electrones libres con iones positivos de la red, aunque para muchos otros metales esta imagen es mucho más compleja. Las energías de enlace reales de los cristales metálicos pueden ser muy bajas, como sucede en el caso de los metales alcalinos, que tienen puntos de ebullición y fusión relativamente bajos o muy elevados, como el tungsteno. cuyo punto de fusión es muy alto. Los cristales moleculares son aquellos en los que el enlace entre átomos o las moléculas no es iónico ni covalente, sino que se origina exclusivamente en fuerzas dipolares existentes entre los átomos o las moléculas del cristal. A pesar de que un átomo o una molécula no tiene un momento dipolar promedio, por lo general tendrá un momento dipolar instantáneo y fluctuante que se origina en las posiciones instantá-

30 Redes cristalinas y tipos de cristales neas de los electrones dentro de sus órbitas. Este momento dipolar instantáneo es la fuente de un campo dipolar electrostático que, a su vez, puede inducir un momento dipolar en otro átomo u otra molécula. La interacción existente entre el momento dipolar original y el inducido es de atracción y puede servir para unir un cristal en ausencia de un enlace de tipo iónico y covalente. Las fuerzas de enlace que se originan en interacciones dipolares fluctuantes de esta naturaleza se conocen con el nombre de fuerzas de van der Waals. Casi siempre, estas fuerzas son muy débiles y la energía de enlace que originan disminuye según l/r6 , en donde r es la distancia entre los dipolos. Entonces, los cristales moleculares se caracterizan por energías de enlace reducidas y, en consecuencia, por puntos de fusión y ebullición bajos; por lo general son conductores eléctricos deficientes. Los cristales de compuestos orgánicos generalmente pertenecen a esta clase, como es el caso' de los gases inertes He, Ne, A, etc., en estado sólido.

EJERCICIOS l. Demuestre geométricamente que la estructura tetragonal centrada en la cara es equivalente a una red tetragonal centrada en el cuerpo en la que el lado de la base de la celda unitaria es 1/.,¡2 veces la magnitud que tiene para la disposición centrada en la cara. ¿Por qué son distintas las estructuras cúbicas centrada en la cara y la centrada en el cuerpo? 2. Demuestre que la proporción máxima de espacio que se puede llenar con esferas sólidas acomodadas en varias estructuras es la siguiente para cada arreglo

Cúbica centrada en el cuerpo

7T/6, 7Tv' 3/8,

Cúbica centrada en la cara

7Tv'1¡6,

Hexagonal con empaquetamiento compacto

7Tv'2/6, 7Tv'3!t6.

Cúbica simple

Estructura del diamante

3. Analice desde el punto de vista físico el porqué un cristal real no puede tener un eje de un múltiplo de cinco de simetría rotativa. 4. (a) Dibuje los bosquejos que ilustren Jos planos (100), (110) y (111) para una celda • unitaria cúbica. (b) ¿Cuántos planos equivalentes {lOO'}, ( 110} y { 111} existen en un cristal cúbico? Considere que los planos (hkl) y (hkl) son idénticos. 5. (a) ¿Cuántos planos equivalentes {123} existen en un cristal cúbico? (b) ¿Cuántos planos equivalentes { 111} existen en un cristal ortorrómbico? (e) ¿Cuántos planos equivalentes { 123} existen en un cristal ortorrómbico? En todos estos casos se considerará que los planos (hkl) y (hkl) son idénticos. 6. Demuestre que en un cristal cúbico la dirección [hkl] es normal al plano (hkl). 7. Demuestre que las intersecciones entre los ejes y Jos planos adyacentes (hkl) a Jo largo de los ejes, a-, b- y e- dentro de una estructura tridimensional son a/h, b/k y e/1, respectivamente, utilizando una extensión de los métodos que se usaron en el caso bidimensional dt' la sección 1.5. 8. Demuestre que para las fuerzas de van der Waals, la energía de interacción de los átomos y las moléculas desciende en la forma lfr6, en donde r es la distancia que hay entre los átomos o las moléculas interactuantes. Nota: principie teniendo en cuenta la energía potencial de un dipolo eléctrico en un campo eléctrico externo. 9. De acuerdo con los resultados de la teoría electromagnética de Maxwell para ondas planas, demuestre que en el caso de un conductor muy bueno (a~oo, K ~oo, a= conductividad, K =constante dieléctrica) se debe esperar un alto grado de reflectividad superficial y una gran absorción interna.

CAPITULO

2

Análisis cristalográfico con rayos X 1.1

INTRODUCCION

El uso de la difracción de los rayos X como técnica para analizar la estructura de los cristales, data del descubrimiento de los efectos de difracción de los rayos X en muestras de un monocristal, efectuado por von Laue en 1912. Laue predijo que :0s átomos de un espécimen monocristalino producirían la difracción de un haz de ::o~ os X monocromático y paralelo, originando una serie de haces difractados cuyas .:!necciones e intensidades dependerían de la estructura reticular y la composición ":.~ímica del cristal. Estas predicciones se verificaron en un plazo muy corto, gracias 1 los trabajos de Friedrich y Knipping. En la figura 2.l(a) se muestra un diagrama esquemático del arreglo experimental correspondiente. La ubicación de los máximos de difracción fue explicada por W. L. Bragg, 1 a base de un modelo muy simple en el que ;.e supone que la radiación X se refleja especularmente desde los planos sucesivos de los

fi!~Jra

1

2.1.

(a) Diagrama esquemático de la difracción de rayos X obtenida con la técnica de Laue.

W.L. Bragg, Proc. Cambrige Phil. Soc. 17, 43 0912).

31

32 Análisis cristalográfico con rayos X

Figura 2.1.

(continúa) (b) Un patrón de difracción de Laue de un cristal de fluoruro de litio, haz incidente de rayos X a lo largo de una dirección { 100} (fotografía por cortesía de H. A. McKinstry, Materials Research Laboratory, Pennsylvania Sta te University).

471" ~~--~~----~~L-~~--~~~----~~----~671"

Planos del cristal

AB = AC =d sen 8

Figura 2.2.

Representación de Bragg de una difracción de rayos X, de acuerdo con reflexion.:s en fase desde planos sucesivos de un sistema particular (hk/).

Introducción

33

diversos sistemas (hkl) del cristal, y en el que los máximos de difracción sólo se encuentran para direcciones de incidencia y reflexión tales que las reflexiones de los planos adyacentes de un sistema interfieran en forma constructiva, con diferencias de fase de 2rrn radianes, en donde n es un entero. Según este experimento, la diferencia de trayectoria para reflexiones sucesivas sería igual a un número entero de longitudes de onda de los rayos X. Sin embargo, esta diferencia de trayectoria, de acuerdo con la figura 2.2, es 2d sen e, en donde d es el espaciamiento entre planos átomicos adyacentes, tal y como lo dan las expresiones (1.5-2) o (1.5-5) y e es el ángulo de incidencia entre el plano atómico y el haz incidente. Por tanto, los haces fuertemente difractados deben propagarse, fuera del cristal, en direcciones para las que se satisface la ecuación de Bragg

nA.= 2d sen e

(2.1-1)

A partir de 1916, la observación experimental de los patrones de difracción de rayos X se simplificó enormemente gracias a la introducción del método de potencia de Debye y Scherrer. 2 Como se ilustra en la figura 2.3(a), en este método se deja pasar un haz monocromático paralelo lit> rayos X a través de un espécimen finamente pulverizado. En forma puramente accidental, algunos de los microcristales del espécimen pulverizado estarán orientados en el ángulo correcto de difracción para un conjunto particular de planos (hkl), como se expresa en (2.1-1) y el haz difractado

'

.

'

.

\'

'

.

1

)\

;

¡

(b)

Figura 2.3.

2

(a) Diagrama esquemático de la difracción de rayos X obtenida con la técnica del polvo de Debye-Scherrer. (b) Un patrón de difracción de polvo, de Debye-Scherrer a partir de una muestra de un óxido compleJO de escandia y circonio (fotografía por cortesía de H. A. l\lcKimtry, Materials Research Laboratory, Pennsylvania State University).

P. Debye y P. Scherrer, Physikal, Zeitschr. 17, 277 (1916).

34

Análisis cristalográfico con rayos X

se produce inmediatamente. Puesto que la condición de difracción se puede satisfacer para cualquier orientación angular posible de la normal a los planos de dispersión alrededor del eje del haz incidente, y dado que siempre habrá microcristales orientados en tal forma que produzcan la difracción (hkf) para cualquier valor de , el haz difractado tendrá la forma de un cono cuyo ángulo de abertura es e y no sólo un haz de rayos. Se acostumbra colocar una tira de película en la pared interior de una cámara cilíndrica, concéntrica con la muestra, con el fin de interceptar una porción específica de estos conos de difracción, que son una serie de arcos producidos sobre dicha película. En la figura 2.3(b) se ilustra un patrón pulverizado logrado mediante este sistema.

2.2

FISICA DE LA DIFRACCION DE LOS RAYOS X: LAS ECUACIONES DE VON LAUE

Los rayos X se pueden producir fácilmente permitiendo que electrones de alta energía choquen contra un ánodo metálico que constituye el blanco. Los rayos X producidos en esta forma poseen, además de un espectro de fondo continuo, algunas líneas espectrales muy intensas y casi monocromáticas cuya frecuencia es característica del material del blanco. Estas líneas se originan debido al paso de electrones de capas internas del átomo a estados de mayor energía de los cuales se apartan para volver al estado base original con la consecuente emisión de rayos X. La producción de rayos X debido a la interacción de electrones de alta energía con la materia se analiza más detalladamente en la obra de Leighton. 3 Si existe un potencial V0 entre el cátodo y el ánodo de un tubo de rayos X, los electrones adquieren una energía eV0 -en donde e es la magnitud de la carga electrónica- al llegar al ánodo. El cuanto de rayos X más energético que pueden producir tales electrones es aquel para el que la energía del cuanto hv es igual a eV0 • En consecuencia, para este cuanto, eV0

= hv =he/A.,

(2.2-1)

en donde h( = 6.62 x 10- 27 erg-seg) es la constante de Planck. De donde, la longitud de onda de rayos X más corta que se puede producir es

A.=~ l/ . e o

(2.2-2)

Para un voltaje de 10 kilovolts, esto demuestra que la longitud de onda mínima de rayos X que se puede excitar es 1.24 x I0- 8 cm o sea, 1.24 unidades Angstrom. Esta magnitud es del orden de las distancias interatómicas de cristales reales y, de acuerdo con la ecuación de Bragg (2.1-1), es la apropiada para producir efectos de difracción observables sin recurrir a valores extremos de d y e. Por tanto, en un tubo de rayos X en el que los electrones se aceleran mediante un potencial de unas cuantas decenas de kilovolts, se puede considerar satisfactorio para producir rayos X apropiados para el trabajo de difracción cristalográfica.

3 R B. 1 ei¡•hton, l'rinl"iples o( Modern Physics, McGraw-Hill Book Co., Inc. Nueva York (1959), p 405 d 21.

Física de la difracción de los rayos X

35

Cuando los átomos de un cristal están sometidos a una radiación electromagnética, por ejemplo, los rayos X, se ejercen sobre ellos fuerzas eléctricas debidas a la interacción de las partículas cargadas de los átomos con el vector del campo eléctrico de la onda electromagnética. Debido a esto, los electrones atómicos vibran armónicamente a la frecuencia de la radiación incidente sufriendo una aceleración. Estas cargas aceleradas vuelven a irradiar energía electromagnética, de acuerdo con la teoría electromagnética, a la frecuencia de vibración, es decir, a la de la onda incidente. A las frecuencias de la luz visible en donde la longitud de onda incidente es mucho mayor que las distancias interatómicas, la superposición de las ondas reirradiadas o dispersas en esta forma por los átomos individuales del cristal, produce solamente los efectos bien conocidos de la refracción y la reflexión ópticas. Sin embargo, a las frecuencias de los rayos X, la longitud de onda incidente es comparable al espaciamiento interatómico y se puede observar la difracción de la radiación de los átomos del cristal. Bragg supuso que los sistemas de planos cristalinos reflejarían especularmente los rayos X, siempre y cuando se satisficiera la condición para la interferencia constructiva entre las reflexiones de planos atómicos sucesivos. A continuación se examinará en detalle la forma en que los rayos X dispersados de diferentes átomos individuales se pueden recombinar de varias maneras. Primero se examinará la radiación dispersada por dos centros de dispersión idénticos separados por una distancia r. El vector n 0 se define como un vector unitario en la dirección del haz incidente y se considera que el vector n 1 es un vector unitario en una dirección arbitraria de dispersión, como se indica en la figura 2.4. Se supone que la radiación incidente es un haz paralelo y el haz disperso se detecta en un punto de observación muy distante. Por tanto la diferencia de trayectoria entre la radiación dispersa en P y la que se dispersa en O es PA - OB = r • n0

-

r • n 1 = r • (n 0

-

n 1 ).

(2.2-3)

El vector n 0 - n 1 =N es la normal a lo que en la representación de Bragg se denomina plano de reflexión, si n 1 fuera una dirección de difracción, como se ilustra en la figura 2.5. De acuerdo con esta figura, también es evidente que la magnitud de este vector es

(2.2-4)

N=2sen0.

p

Figura 2.4.

Geometría de la situación de dispersión de rayo~ X que ~e .mali1a en la ~cc­ ción 2.2.

36 Análisis cristalográfico con rayos X

/ / /

/ / /

Plano de

e_ Figura 2.5.

_L_ di~ersión

Relación geométrica del haz incidente y el difractado, la normal de dispersión y el "plano de dispersión".

La diferencia de fase rl>r entre la radiación dispersa en los dos puntos es, sen· cillarnente 27T/A veces la diferencia de trayectoria, de donde, (2.2-5) Ahora bien, para que haya una difracción máxima en la dirección n cada átomo del cristal debe contribuir a la dispersión en esa dirección, con una diferencia de fase igual a un múltiplo entero de 27T radianes. Para que esto sea verdad, lo único que se necesita es que la radiación de los átomos separados por los vectores reticu· lares primitiJ;os a, b, y e se sumen en fase, ya que en este caso, la contribución de otros átomos separados del origen por combinaciones enteras de estos vectores se sumarán en fase obligatoriamente. Si las contribuciones de dispersión de átomos circunvecinos tuviera una diferencia de fase distinta, siempre sería posible encontrar un átomo del cristal que contribuyera con una radiación exacta de 1T radianes fuera de fase con la contribución de un átomo dado; estas contribuciones se cancelarían átomo por átomo, y no darían un haz difractado. Si se analiza un ejemplo en el que átomos circunvecinos a lo largo de la dirección a contribuyen con componentes de radiación en una dirección dada, que están fuera de fase en 1T radianes (o 7T/2, 7T/4, 7T/6, etc.,) se verá con claridad que esta afirmación es fácil de corroborar. En consecuencia, lo único que se requiere es que se obtenga un múltiplo entero de 27T (2.2-5), en donde r es igual a a, b o e, es decir, se requiere simultá· neamente que 2n -(a· N)= 2nh' = 2nnh }.

2n

T

(b • N)

= 'J.nk' = 2nnk

2n -;-(e· N)= 2nl' l.

(2.2-6)

= 2nnl.

En estas expresiones, h', k', !' pueden ser cualquiera de tres enteros; en general estos tres enteros pueden contener el factor común entero de mayor valor n superior a la unidad, en cuyo caso se puede escribir h' = nh, k'= nk y !' = nl, en

Factor de dispersión atómica

37

donde h, k y 1 son ahora tres enteros en la misma relación que h', k' y 1 ' sólo que no tienen un factor común mayor que la unidad. Si h', k', y 1 ', no tienen un factor común mayor que la unidad, entonces se considera que n es la unidad. Si a,~. y 'Y son los ángulos entre la normal de dispersión N y los ejes a-, b- y e- del cristal, respectivamente, entonces, de acuerdo con (2.2-4), a • N= aN cosa= 2a sen() cosa, etcétera, de donde (2.2-6) se puede expresar también como sigue 2a senO cos oc= h'A. = nh.A., 2b sen (} cos fJ = k' A. = nk.A.,

(2.2-7)

2c sen (} cos y = l' A. = nl.A.. Estas expresiones se conocen con el nombre de ecuaciones de Laue. Para una longitud de onda incidente dada, >.., y valores e~pecíficos de los enteros h, k, l y n, las ecuaciones determinan un cierto valor de () y dos de las tres cantidades (cos a, cos ~. cos 'Y). No obstante, sólo dos de las trc~ cantidades (a,~. 'Y) son independientes debido a que una vez que se fijan los ángulos entre un vector y dos de los tres ejes de coordenadas, la dirección del vector queda fija y el tercer ángulo se puede determinar trigonométricarnente. Por ejemplo, en un sistema de coordenadas ortogonales, un resultado elemental de geometría analítica es que cos2 a + cos2 ~ + cos 2 'Y = l. Las tres ecuaciones (2.2-7) sirven, por tanto, para determinar un valor único de () y N, definiendo así una dirección de dispersión. Los cosenos de dirección de la normal de dispersión N son, de acuerdo con la expresión (2.2-7), proporcionales a h/a, k/b y 1/c. Sin embargo, los planos cercanos cuyos índices de Miller son (hkl), se intersecan con los ejes a-, b- y e- a intervalos a/h, b/k y c/1; por tanto, los cosenos de dirección de la normal a la familia de planos (hkl) son también proporcionales a hja, k/b y ljc, de acuerdo con (1.5-1). La normal de dispersión N es, por ende, idéntica a la normal de los planos (hkl) y, en consecuencia, los planos (hkl) pueden tomarse como los de reflexión en la representación de Bragg. Se puede demostrar que la ecuación de Bragg se sigue de las ecuaciones de Laue, haciendo que h =a cos ajd, k= b cos ~/d, 1 =ecos 'Y/d, en la expresión (1.5-1), de acuerdo con lo cual una de las tres ecuaciones de Laue se reduce a nA.= 2d sen 8, en donde d es la distancia entre los- planos adyacentes del sistema (hkl) y en donde el orden n de la difracción es el factor común más alto entre los órdenes de interferencia h', k' y l '. Por lo general, para referirse a una reflexión de rayos X observada, se citan los números (h' k' 1 ') que dan el orden de interferencia entre los átomos circunvecinos a lo largo de los ejes cristalinos; en consecuencia, el máximo de difracción de primer orden para los planos ( 111) se menciona como la reflexión (111), el máximo de difracción de segundo orden para el mismo conjunto de planos (n = 2, h' = 2h, k' = 2k, 1' = 21) es la reflexión (222), el tercer orden es la reflexión (333), etc.

2.3

FACTOR DE DISPERSION ATOMICA

Los cálculos de la sección anterior se basaron en la supostcton de que los centros de los puntos de dispersión coincidían con los puntos reticulares. Ahora,

38 Análisis cristalográfico con rayos X conviene tomar en cuenta que la dispersión, que es el resultado de una interacción entre los electrones del átomo y un haz de rayos X, puede desarrollarse en cualquier punto en que se encuentren los electrones. En otras palabras, se desea modificar los cálculos considerando que la radiación X se dispersa debido a una distribución continua de "densidad de electrones" relacionada con cada punto reticular. Como se verá más tarde, este concepto concuerda totalmente con el punto de vista de la mecánica ondulatoria del proceso. Sin embargo, se debe hacer notar que se está descuidando el efecto de dispersión de los núcleos atómicos que interactuán con mucha menor fuerza con los rayos X. Se encontrará que, debido a la extensión finita de la distribución de densidad e.lectrónica, la amplitud de la radiación difractada se multiplica por un factor que incluye la longitud de onda de los rayos X, el ángulo incidente y la distribución de densidad electrónica asociada con los átomos. Se principiará inquiriendo sobre la relación entre la amplitud de difracción de los rayos X, en el ángulo de Bragg, dispersados por un elemento de carga p(r)dv, ubicado en un elemento de volumen dv alrededor del punto r, y la que dispersa un electrón de un solo punto en un punto de la red, como se ilustra en la figura 2.6. En este caso, p(r) es la densidad de electrones, p(r) dv es la probabilidad de que se encuentre un electrón dentro del elemento de volumen dv. Por supuesto, es necesrio que

ip(r) dv = Z,

(2.3-1)

en donde Z es el número de electrones por átomo, esto es, el número atómico de los átomos de los que está compuesto el cristal. La integral anterior se toma sobre todo el espacio; aunque al hacer los cálculos se supone habitualmente que las "nubes de electrones", relacionadas con diferentes átomos del cristal, no se superponen en forN

Figura 2.6.

Geometría de la situación de dispersión de rayos X que se analiza en la· sección 2.3. Radiación dispersada en el ángulo ele Bragg por una densidad electrónica contenida en el elemento de volumen dv en r, que se compara con la que se dispersaría desde un ciPctrón de punto en O.

Factor de dispersión atómica

39

ma apreciable, de donde, dicha nube electrónica de un solo átomo queda confmada al volumen de una celda unitaria. La diferencia de fase if>n entre la radiación dispersada en el origen y la que se dispersa en el elemento dv en r es, de acuerdo con (2.2-5) cj>, =

2n

T

(r • N).

(2.3-2)

Si la amplitud de dispersión desde el electrón del punto a lo largo de la dirección n 1 se representa mediante Aei(ks-wt), en donde k= 2n/A. y ses una coordenada de distancia a lo largo de la dirección de dispersión n 1 , entonces, la amplitud de dispersión a lo largo de tal dirección, a partir del elemento dv, será p(r)dv veces más fuerte (puesto que será proporcional a la can ti dad de carga en ese elemento) y estará fuera de fase en una cantidad dada por (2.3-2). La relación de la amplitud de la radiación que dispersa el elemento dv con la que dispersa un electrón de punto en el origen que se denominará df, será entonces

dr =

Aei(ks-wt)+i,p(r)

.

dv

Ae•
J

.

= pfr)é2n•fA.)(r·N) '

dv

·

(2.3-3)

Si se integra sobre todo el espacio, se encontrará la relación f de la amplitud dispersa en el átomo entero con la de un electrón de punto, en un punto reticular. De donde,

f

1

=

p(r)e(2ní/A.)(r·N)

dv.

(2.3-4)

No obstante, de acuerdo con la expres1ón (2.2-4) 2n

T

(r ·N)=

2n

T

Nr cos 8' =

en donde

11 =

4rr

T

r sen() cos ()' =

w

4rr

"T sen 8.

cos ()',

(2.3-5)

(2.3-6)

Si la densidad de carga del átomo es esféricamente simétrica y, por tanto, es una función exclusiva de r, p(r) = p(r) y

f

=

f' J: J:n

p(r)eiw cos 8 ' r 2 sen()' dr d()' dc/J.

(2.3-7)

Se pueden evaluar las partes angulares de esta integral, integrando primeramente sobre Q>, luego sobre 8' (haciendo que x = cos 8', dx =sen O' d8'), y expresando finalmente los factores exponenciales como funciones trigonométricas, lo cual da

f(!l) =

l

oo

sen 11r

4rrr 2 p(r) - - dr.

o

(2.3-8)

Jll"

Esta cantidad, es decir, la relación de la amplitud dispersada por el átomo real con la que dispersa un solo electrón sobre un punto reticular, se denomina factor de dispersión atómica. Puesto que 8 -+O, Jl-+ O y sen JlY/JlY-+ 1, de donde

!Ímf(tt) =

11~o

Joj 4rrr p(r) dr = fp dv = Z, 00

2

v

(2.3-9)

40 Análisis cristalográfico con rayos X Los valores de p(r) deben obtenerse, evaluando, de acuerdo con la mecamca cuántica, las "funciones de onda" de los átomos del cristal. En un capítulo posterior se verá en qué consiste este proceso. En la práctica, las funciones ondulatorias de los átomos libres se utilizan muy a menudo en los cálculos del factor de dispersión, para obtener resultados aproximados para las intensidades esperadas; mientras que las funciones ondulatorias reales modificadas se emplean para los átomos, cuando éstos se encuentran en una red cristalina.

2.4

FACTOR GEOMETRICO DE LA ESTRUCTURA

Hasta ahora, se ha supuesto que se trata de celdas unitarias con átomos exclusivamente en los vértices (es decir, celdas unitarias primitivas). Si se desean predecir las características de la radiación difractada desde cristales con celdas unitarias complejas, que contienen más de un átomo, como sucede en las celdas cúbicas para las estructuras cúbica centrada en el cuerpo y cúbica centrada en la cara, se debe explicar la interacción de los haces que se difractan desde los diversos átomos, dentro de la celda unitaria. Si para la reflexión (h' k'!') se representa la relación de la amplitud de radiación que dispersa toda la celda unitaria en función a la que dispersa un electrón de punto en el origen, por medio de F(h' k'!'), entonces F(h'k'l') =

¿¡;ei4>;.

(2.4-1)

i

En este caso, [¡ es el factor atómico de dispersión para el iésimo átomo de la celda unitaria y cp¡ se relaciona con la diferencia de fase entre la radiación dispersada en el origen y la dispersada del iésimo átomo de la celda unitaria. La suma se obtiene, tomando en cuenta todos los átomos que pertenecen a la celda unitaria. La diferencia de fase cjJ¡ está dada por (2.3-2), de donde (2.4-1) se puede expresar como sigue: F(h'k'l') = ¿¡;e<2xi/.l.)(r;·N>,

(2.4-2)

i

en donde r¡ es un vector desde el origen hasta el iésimo átomo de la celda unitaria. Si las coordenadas de posición fraccionales del iésimo átomo son (x¡, y¡, z¡), de acuerdo con lo definido en la sección 1.4, entonces, r¡ se puede expresar así: f¡

= X¡a + y¡b + Z¡C.

(2.4-3)

Sin embargo, de acuerdo con la ecuacwn (2.2-6), a · N= h'X, etc.; substituyendo la (2.4-3) en la (2.4-2) y utilizando este resultado, se encuentra que r; ·N= A(h'x¡ +k' y¡+ l'z;),

de donde

F(h'k'l') =

Lf¡e2xi(h'x;+k'y1 +1'z;). i

(2.4-4) (2.4-5)

Factor geométrico de lo estructura

41

Cuando todos los átomos del cristal son idénticos, el resultado se puede expresar en una forma especialmente simplificada, porque, en ese caso, todas las[¡ tienen el mismo valor f Por tanto, la ecuación (2.4-5) se convierte en

S=

en donde

F(h'k'l') = fS

(2.4-6)

L

(2.4-7)

e2ni(h'.x¡+k'y¡+l'z¡).

i

Por tanto, la amplitud total dispersada está dada por el producto del factor de dispersión atómica y un factor S, que está regido por la disposición geométrica de los átomos, dentro de la celda unitaria y que se conoce como el factor geométrico estructural. Para los cristales en los que no todos los átomos son idénticos, esta separación es imposible y, en tales casos, se utilizará la forma más general (2.4-5). La intensidad del haz difractado es proporcional al cuadrado de la amplitud F o, más exactamente, dado que F es compleja, al cuadrado del valor absoluto de F, que es F* F, en donde F* es el conjugado complejo de F Si F(h' k' l '), como lo expresa (2.4-5), se escribe como el número complejo a+ i{3, entonces, F* =a- i(3 y (2.4-8) en donde

a:=

= L [f; cos 2n:(h'x; +k' y;+ l'z;)],

Re(F)

i

y

P = Im(F) = L [J¡sen 2n:(h'x; +k' y¡+ l'z¡)]. i

(2.4-9)

(2.4-10)

Como ejemplo, se verá el caso de un cristal cúbico centrado en el cuerpo, en el que todos los átomos son idénticos. En esta estructura, se tienen dos átomos dentro de la celda cúbica unitaria: un átomo del vértice y otro en el centro del cuerpo; se procede a asignar arbitrariamente el átomo del vértice cuyas coordenadas (x¡, y¡, z¡) son (0, O, O) a la celda unitaria y no se consideran los otros átomos de vértice; el otro átomo de la celda es el del centro del cuerpo, que pertenece exclusivamente a la celda unitaria, cuyas coordenadas son (t.t.t). Por tanto, de acuerdo con esta situación, la amplitud de difracción para la dirección de difracción (h' k' l ') es la que señalan las expresiones (2.4-6) y (2.4-7), F(h'k'l') =

fL e2>ti(h'.x,+k'y,+t'••> = f[l + ein(h'+k'+t'>].

(2.4-11)

i

Puede pensarse que la forma en que un átomo de vértice se asignó a la celda y los otros se excluyeron, es demasiado arbitraria, por lo que se puede proponer un procedimiento más razonable, en el que i de cada átomo de vértice se asigna a la celda, dejándolos en sus respectivas ubicaciones~ Esta forma alternativa de proceder lleva exactamente a la misma expresión que la que se obtuvo en (2.4-11) para el factor de estructura geométrica. La verificación de esta afirmación quedará como tarea para el lector. En general, la asignación de los átomos que pertenecen a la celda unitaria puede hacerse en cualquier forma arbitraria, como antes se hizo, siempre que se le asigne a ésta el número correcto de átomos de cada categoría (cara, vértice, borde, interior).

42 Análisis cristalográfico con rayos X De acuerdo con (2.4-11), el factor geométrico de la estructura 1 + exp(hr(h' + k' + l ')] desaparece para cualquier reflexión (h'k'l ') para la que h' +k'+ l' sea un número impar, ya que exp(mri) = -1 cuando n es impar. Por tanto, en la estructura cúbica centrada en el cuerpo, faltan ciertas reflexiones (h'k'l '), que estarían presentes en una estructura cúbica simple, con la misma dimensión lateral del cubo. Por ejemplo, no existe una reflexión (100), aunque sí se tiene la reflexión (200); del mismo modo, no hay la reflexión (111) aunque se tiene la (222). Este efecto se puede comprender físicamente, cuando menos en el caso de la reflexión (100), observando primeramente que para una estructura cúbica simple, los haces reflejados desde las caras superior e inferior del cubo de la celda unitaria, difieren 2rr en fase para la dirección de difracción (1 00). Sin embargo, en la estructura cúbica centrada en el cuerpo que tiene la misma dimensión lateral del cubo, existe otro plano de átomos (centros de cuerpos), ubicados paralelamente y a la mitad entre los planos de las caras superior e inferior del cubo de las celdas unitarias, como put..de verse en la figura 2.7. La densidad de átomos en estos planos intermedios es la misma que la de los planos de las caras superior e inferior del cubo y, por tanto, dan origP.n a haces difractados, con la misma intensidad que los producidos por los planos superior e inferior de la celda unitaria; pero están fuera de fase con estos haces por rr radianes. Los haces difractados desde los planos superiores y los del centro del cuerpo interfieren en forma destructiva en pares, sin producir un haz difractado neto para este conjunto de condiciones. No obst?.nte, la reflexión (200) está presente, debido a que, en ese caso, los planos superior e inferior dan origen a haces que están 4rr fuera de fase. Entonces los planos de los centros de cuerpo contribuyen, con haces que difieren 2rr en fase de las reflexiones obtenidas de los planos superior e inferior, reforzándolos en lugar de cancelarlos. Las otras reflexiones faltantes para la estructura cúbica centrada en el cuerpo se pueden explicar físicamente, siguiendo la misma trayectoria de razonamiento.

Los haces se refuerzan

(1 00)

Figura 2.7.

reflexión

Celda unitaria c.c.c. reflexión (200)

Relaciones de fase para los ángulos de difracción (100) y (200), en una estructura cúbica centrada en el cuerpo.

La red reciproca 2.5

43

LA RED RECIPROCA

En este punto, conviene presentar el concepto de la red recíproca, que es una estructura reticular de puntos, que está relacionada en cierta forma con la red cristalina real. La condición de Bragg para la difracción de rayos X se puede expresar en una forma muy sencilla con la ayuda de la red recíproca y en uno de Jos vapítulos posteriores se verá que el comportamiento mecánico ondulatorio de los electrones en las redes cristalinas periódicas se entiende más fácilmente en relación con la red recíproca del cristal. Si a, b y e son los vectores primitivos de translación de una red cristalina real, los vectores primitivos de translación de la red recíproca, a*, b*, y e* se definen mediante las relaciones

y

a*· a= b* • b =e*· e= 1

(2.5-1)

a*· b =a*· e= b* ·e= b* ·a =e*· a= e*· b =O.

(2.5-2)

Puesto que, de acuerdo con (2.5-2), a* • b =a* · e= O, el vector a* es perpendicular al plano determinado por b y c. En consecuencia, es paralelo al vector b x e y se puede expresar como un múltiplo de ese vector, esto es

a*= A(b X e),

(2.5-3)

en donde A es una constante escalar. Sin embargo, de acuerdo con (2.5-1)

a* ·a= A(b X e)· a= 1,

(2.5-4)

de donde, resolviendo para A y substituyendo el valor así obtenido en {2.5-3),

a* =

b X e . a· b X e

(2.5-5)

De igual manera, se puede demostrar que

b* = e X a a· b X e

* = a-X- be a· b X e Si se utiliza el mismo planteamiento general, se pueden obtener las siguientes transformaciones inversas

b* X e* a = a* . b* X e*,

(2.5-6)

etcétera. Como ejemplo, supóngase que se desea determinar la red recíproca de una estructura cúbica centrada en la cara. Se debe principiar con la celda unitaria pri

44

Análisis cristalográfico con rayos X

mitiva de la figura 1.5(a), para la cual, los vectores de base primitivos a, b y e se pueden expresar como sigue: a('lx + ., .) a= 2 (2.5-7)

e=

.) 2.a('•, + •.'

en donde a es el lado de la celda cúbica y en donde el eje de la coordenada x se toma a lo largo de a, el eje y va sobre b y el eje z pasa por c. Entonce~, 2

* a =

a4

b X e

=

a· b X e

de igual modo,

Ci.x + i.) X (i, + i.)

1

(' . . )· = - •x + •, - •. '

3

a ('lx + IJI . ) ' [('lx + lz . ) X ('1)1 + lz . )]

S

b* = -1 ('lx a

-

.

IJI

+ lz. ) '

a

e * = -1 ( . a

•) -•x + .,• + ••.

(2.5-8)

Es evidente que esos vectores tienen las direcciones cúbicas diagonales, al igual que los vectores primitivos de la estructura cúbica centrada en el cuerpo, como se puede ver en la figura 1.5(b). Además, se debe observar que el espaciamiento reticular de la red recíproca es proporcional a 1/a. O sea, que cualquier vector r* que conecte dos puntos reticulares de la red recíproca, debe tener la forma

r* =la*+ mb* + ne*,

(2.5-9)

en donde /, m y n son enteros; al substituir las expresiones correspondientes a a*, b*, y e* de (2.5-8) en (2.5-9), es evidente que los puntos de la red recíproca deben tener (x, y, z) coordenadas de la forma (x,y,z)

1

= - [(l + m a

n),

(l- m+ n),

( -l +m+ n)],

(2.5-10)

en donde l, m y n pueden tomar cualquier valor entero. En la tabla 2.1 se presenta una tabulación de estos puntos reticulares posibles; los diversos casilleros de la tabla corresponden a valores específicos de l y m, esto hace que la forma de las coordenadas indicadas en cada casillero varíe sólo con n, de acuerdo con (2.5-1 0), en función de los valores correspondientes de l y m, ahí incluidos. En la tabulación que se da aquí, cualquier punto cuya coordenada x, y o z exceda de 2 (aparte del factor constante 1/a, que no se incluye en las entradas de la tabla), queda descartado por completo; por tanto, los puntos que se conservan son suficientes para describir 8 celdas unitarias de la red recíproca. Cuando se grafican estos puntos, insertando el factor constante 1/a -y se considera la forma que tienen los vectores primitivos de la red recíproca- es evidente que fa red recíproca resultante es una estructura cúbica centrada en el cuerpo, cuya dimensión lateral del cubo es 2/a. En forma similar, se puede demostrar que la red recíproca para una estructura real cúbica centrada en el cuerpo, es una red cúbica centrada en la cara.

TABLA 2.1. Puntos reticulares para la red recíproca cúbica centrada en la cara (Todos los puntos son de la fonna [(/+m- n), (/-m+ n), (-1 +m+ n)])

m= -2

1= -2

1 = -1

1=0

(-n- 4, n, n) -2, -2, -2

( -n- 3, n +- 1, n- 1) -2, O, -2

( -n- 2, n + 2, n- 2) -2, 2, 2

(-n-2,n,n) -2, O, O -1, -1, -1 O, -2, -2

(- n - 1, n + 1, n - 1) -1,1,-1 - 2, 2, O 0,0, -2

(-n-3,n-1,n+1)

m= -1

--2, -2,

o

( -n- 2, n- 2, n

m=O

-2, -2, 2

+ 2)

( -n- 1, n- 1, n + 1) -1, -1,1 -2, o, 2 O, -2,0

(- n, n - 2, n + 2) m= 1

m=2

O, -2,2

(-n, n, n)

0,0,0 -1, 1, 1

-2, 2, 2 1, -1,-1 2, -2, -2 (1 - n, n- 1, n + 1) 1, -1, 1

0,0,2 2, -2, o (2 - n, n - 2, n + 2) 2, -2,2

l

(- n, n

=

1=2

1

+ 2, n -

2)

O, 2, - 2

(1-n,n+ 1,n-1) 1, 1, -1 O, 2,0 2,0, -2

(2- n, n, n)

2,0,0 1, 1, 1 O, 2, 2 (3- n, n- 1, n + 1) 2,0,2

(2 - n, n + 2, n - 2) 2, 2, -2

(3-n,n+ 1,n-1)

2,2,0

(4- n, n, n)

2, 2, 2

46 Análisis cristalográfico con rayos X Una de las propiedades de la red recíproca es que un vector r* = h'a* + k'b* +!'e* desde el origen hasta cualquier punto reticular de la red recíproca es normal al plano (hk[) de la red real. En este caso, la tríada (hkl) es, simplemente, la tríada (h'k'l') dividida por el factor común mayor, n entre (h'k't'), al igual que se hizo en la sección 2.2. En otras palabras, h'/h =k'/k= 1'/l = n. Para demostrar este resultado, se puede observar en la figura 2.8 que el vector AC es igual a - (a/h) + (e/[), y queda dentro del plano (hkl), al igual que el vector AB, que es igual a - (a/h) + (b/k). Sin embargo, utilizando las expresiones (2.5-1) y (2.5-2),

r* · [ -(a/h) +(e//)]= (h'a* + k'b* + l'e*) · [ -(a/h) + (ejl)]

h'

=- h

1' +-¡=O,

(2.5-11) puesto que h'/h

= 1'/l = n,

de acuerdo con (2.2-6). De igual modo,

r* · [ -(a/h) + (b/k)] = (h'a*

+ k'b* + l'e*) · [ -(a/h) + (b/k)] =

-

h'

k'

h +k= O. (2.5-12)

e

a Figura 2.8.

Geometría vectorial en la red directa para los cálculos de la sección 2.5.

Por tanto, el vector r* es perpendicular a dos vectores linealmente independientes, AC y AB, que se encuentran dentro del plano (hkl). Luego, debe ser perpendicular al plano propiamente dicho. Del mismo modo, si n es un vector unitario normal al plano (hk[) de la red real, se puede escribir n = r*/r*, ya que se sabe que r* es un vector normal a (hkl). No obstante, si d es la distancia entre los planos adyacentes (hkl), de acuerdo con (1.5-2), debe ser verdad que

a· n a· r* a· (h'a* + k'b* d=-=-= h hr* hr*

+ /'e*)

n

-- r* '

(2.5-13)

por lo que la magnitud de r* está dada por r* -= n/d,

(2.5-14)

en donde n es un entero que se defme como se indica en la ecuación (2.2-6).

La condición de Bragg 2.6

47

LA CONDICION DE BRAGG EN FUNCION DE LA RED RECIPROCA

La condición de Bragg se puede expresar como una relación entre vectores en la red recíproca. En la figura 2.9, el vector AO que tiene una longitud 1/A. está trazado en la dirección del haz incidente de rayos X y termina en el origen de la red recíproca. Se observará que el origen del vector AO no debe encontrarse necesariamente en un punto reticular de la red recíproca. Se construye una esfera de radio lA alrededor del punto A, que es el centro. Supóngase ahora que esta esfera intersecta algún punto (h'k'l ') de la red recíproca en B. Por tanto, el vector OB representa al vector que conecta el origen de la red recíproca con un punto (h'k'l ') de la red; como tal, debe ser normal al plano (hkl) de la red real y también debe tener la longitud n/d, donde n es el factor común entero de mayor valor a los tres números (h'k'l '). Sin embargo, de acuerdo con las relaciones trigonométricas de la figura 2.9, la longitud de OB se puede expresar también como 2 sen 0/A.. Si se igualan estas dos expresiones para la longitud del vector OB, se tiene que n). =

2d sen

e,

y se satisface la condición de Bragg. En relación con la figura 2.9, también es evidente que el vector OB representa una normal a los planos de reflexión (hkl) y que el vector AB lo es en la dirección del haz difractado. Esta última proposición se entenderá con mayor claridad, si se traslada el vector AB paralelo consigo mismo, hasta que su origen descanse en el punto O, en que se verá que AO, OB y AB están en la relación familiar de la dirección del haz incidente, así como la dirección normal de dispersión y del haz de difracción. De acuerdo con esta construcción geométrica, es evidente que la condición de Bragg se satisfará para una longitud de onda dada por cada intersección de la superficie de una esfera de tadio 1/A. trazada alrededor de A, con un punto de la red recíproca. En cada caso, el ángulo apropiado de Bragg estará dado por el ángulo comprendido entre el vector AO y un plano normal a OB. Cuando la condición de Bragg se satisface en esta forma, los vectores AO y AB constituyen un triángulo isósceles con un vector OB de la red recíproca. De acuerdo con esta disposición de los vectores, como se ilustra en la

Figura 2.9.

Geometría vectorial de la reflexión de Bragg en la red recíproca.

48 AniÍiisis cristalográfico con rayos X figura 2.9, se puede observa~ que AB debe ser la suma vectorial de AO y OB y la geometría vectorial de la figura 2.9 permite expresar la condición de reflexión de Bragg, en un forma especialmente sencilla. Para este fin se supone que todos los vectores de la figura 2.9 se multiplican por un factor escalar constante de 27T, como se indica en la figura 2.10. Por tanto, en esta figura, el vector G es simplemente 27T veces el vector OB de la figura 2.9 y el vector k es 27T veces el vector AO de la figura 2.9. También en este caso, la disposición de los vectores es tal que el vector A 'B' de la figura 2.1 O debe ser la suma vectorial de k y G. Puesto que la magnitud de ese vector y la del vector del

8'

Figura 2.10.

Diagrama vectorial de la figura 2.9, ampliado de acuerdo con un factor escalar de 27T y rotulado nuevamente (la notación va de acuerdo con la utilizada por C. Kittel en /ntroduction to Solid Sta te Physics. J ohn Wiley & Sons, Nueva York (1956).

haz incidente k deben ser iguales, en todos Jos casos en que se satisface la condición de Bragg, ésta debe implicar que (k

+ G) 2 = (k + G) • (k + G) = k 2 ,

(2.6-1)

o bien, desarrollando el producto y simplificando, 2k · G

+ G2 =O,

(2.6-2)

en donde G es 27T veces un vector desde el origen hasta un punto reticular de la red recíproca, en donde k es un vector de magnitud 27T/A a lo largo de la dirección del haz incidente de rayos X. La ecuación (2.6-2) es la forma vectorial de la ecuación de Bragg. 4

EJERCICIOS l. l·.n un cristal cúbico se oh~erva una reflexión de primer orden (1 00) a un ángulo incidente de 18° utilizando una radiación X de longitud de onda de 1 5 A ¿Cuál es la di~tancia ~ntre lo~ planos (1 00) del cristal? 4 Esta construcción la originó Ewald (P.P. Ewald, Zeitschrift für Kristallographie 56, 129 (1921) y se denomina, a veces, construcción de Ewald.

La condición de Bragg

49

2. Para el átomo de hidrógeno en su estado energético más bajo, la función de onda está dada por

en donde a0 es el radio de la primera órbita de Bohr, h2j4rr2me2 electrónica para este tipo de átomo está dada por 1/Jfs 1/1 19 , por lo que

= 0.53 A.

La densidad

e-2rJ•o

p(r)

=--. 7TQ~

Si se utiliza esta función de distribución de densidad electrónica, calcule el factor de dispersión atómica para un cristal hipotético, compuesto de átomos de este tipo y grafíquela como función de p. ( = 4rr sen (} (l\). 3. Sea una estructura cúbica centrada en el cuerpo, en la que todos los átomos son idénticos. Demuestre que asignándole a la celda unitaria un octavo de cada átomo de vértice -en su ubicación respectiva de coordenada celular- y el ítomo del centro del cuerpo -en la posición central- se obtiene el mismo resultado para el factor geométrico de estructura de esta red, que derivando dicho factor de acuerdo con la ecuación (2.4-11 ). 4. Encuentre la amplitud de difracción F(h'k'l ') para la reflexión (h'k'l ') de un cristal que tiene la estructura del CsC'l, como se ilustra en la figura 1.7(b). ¿Se podría esperar una reflexión (100) en este cristal? Explique por qué. 5. Encuentre el factor geométrico de estructura para la red cúbica centrada en la cara (donde todos los átomos son idénticos). ¿Cuál de las siguientes reflexiones de rayos X habrá en un cristal de este tipo y cuál faltará en él: (100), (110), (111), (200), (220), (222), (211), (221 ), (123)? 6. Determme el factor geométrico de estructura de la red de diamante. Exprese el resultado como el producto del factor geométrico de estructura para la red cúbica centrada en la cara por otro factor. Indique cuáles de las reflexiones de rayos X mencionadas en relación con el problema 5 se encuentran en dicha estructura y cuáles faltarán en ella? Nota: asigne los átomos a una celda unitaria cúbica, de acuerdo con el diagrama de la figura 1.9. 7. Demuestre que la red recíproca de una estructura cúbica simple es otra red cúbica simple, de donde, dicha estructura es autorrecíproca. 8. Demuestre que la red recíproca de una red cúbica centrada en el cuerpo es una estructura cúbica centrada en la cara. Haga una tabla de los puntos reticulares y grafíquelos para formar un diagrama, basándose en sus resultados.

LECTURAS RECOMENDADAS W. H. Bragg, An Introduction to Crystal Analysis, G. Bell & Sons, Londres (1928). W. L. Bragg,The Crystalline State, Vol. 1, G. Bell & Sons,.,.Londres (1955). R. B. Leighton, Principies o[ Modern Phys;cs, McGraw-Hill Book Company, Inc., Nueva York (1959). A. Taylor, X-Ray Metallography, John Wiley & Sons, Nueva York (1961).

CAPITULO

3

Dinámica de las redes cristalinas 3.1

VIBRACIONES ELASTICAS DE MEDIOS CONTINUOS

Ahora se investigarán las características del movimiento elástico vibratorio de las redes cristalinas. Se encontrará que existen diferencias importantes entre las ondas elásticas, en las estructuras reticulares compuestas de átomos discretos y las ondas que hay en los medios elásticos completamente continuos y homogéneos. Para entender estas diferencias con toda claridad, primeramente se hará un repaso breve de algunas características esenciales de las ondas elásticas en substancias elásticas homogéneas, isotrópicas y lineales. Se analizará detalladamente tan sólo el movimiento ondulatorio unidimensional, pero siempre que sea necesario se tratará de indicar cómo se pueden generalizar los resultados obtenidos para describir sistemas de dos y tres dimensiones. Sea un elemento de una substancia elástica isotrópica y homogénea, de longitud tu y el área transversal uniforme ~Y l:!.z. Cuando no hay deformaciones este elemento se extiende de x a x + ÁX a lo largo del eje x, como se ilustra en la figura 3.1, pero al aplicarle un esfuerzo, se produce una deformación elástica, la

I

Areo

(l

r-uF =ce (x) !:J. y tJ. z 1 X

Figura 3.1.

-u+~u-1

t:J.yt:J.z

\r------t----i-1---. -u-:t:J.u--::___

.._-------+---+-...J

F=ce(x+t:J.x)t:J.yt:J.z

t:J.x-----1 x+t:J.x

Desplazamiento y deformación de extensión de un elemento de volumen que originalmente se extendía de x a x + &. En la condición deformada, el elemento se extiende de x'+u a x + ~x +u+ ~u.

poSictOn de equilibrio del extremo izquierdo del elemento se desplaza una distancia u a lo largo del eje x, y el extremo derecho del elemento se desplaza una distancia u + &. Si el medio elástico es lineal, el esfuerzo aplicado y la deformación resul51

52 Dinámica de las redes cristaliiUls tante se relacionan linealmente, mediante la ley de Hooke. La deformación s se define como la extensión elástica del elemento por unidad de longitud, es decir , Au ou s(x)= hm - = - , &x--+O Ax ox

(3.1-1)

mientras que el esfuerzo es la fuerza por unidad de área que actúa sobre el ele· mento. Por tanto, de acuerdo con la ley de Hooke, si F(x) es la fuerza total que actúa en el punto x, F(x) = cs(x)Ay Az,

(3.1-2)

en donde e es el módulo elástico del material. Del mismo modo, en el punto

X+ _ax, F(x

+ Ax) =

cs(x

+ Ax)Ay Az.

(3.1-3)

La fuerza total ejercida sobre el elemento se debe relacionar con la aceleración del elemento, de acuerdo con la ley de Newton, por lo que F(x

+ Ax) -

F(x)

= c[s(x + Ax) -

s(x)]Ay Az

= ma,

(3.1-4)

en donde m es la masa del elemento y a su aceleración. Desarrollando s(x + & ) como una serie de Taylor, con respecto al punto x, y descartando los términos de segundo o mayor orden en .ax, que en cualquier caso se perderían en el límite, conforme .ax -+ O, se encuentra que os e ox Ax Ay Az

= ma.

(3.1-5)

Sin embargo, la masa del elemento es su intensidad p por el volumen la aceleración es a2 ujat 2 , y la deformación, de acuerdo con la definición {3.1-1) es au;ax. Al efectuar estas substituciones, (3.1-5) se convierte en

.ax Lly &,

ou 2

ox 2

p o2 u

=~

ot 2 •

(3.1-6)

Esta es la ecuación de onda para la amplitud de ondas elásticas en un medio lineal homogéneo, en función de x y t, en donde la deformación elástica se limita a la dirección x. Las soluciones a esta ecuación se pueden escribir en la forma u(x,t) = Aei<wr-znxt.l.l = Aei<wr-kx>,

(3.1-7)

k= 2nfA.

(3.1-8)

en donde,

La solución (3.1-7) representa una perturbación sinusoidal de frecuencia w y longitud de onda X, que se propaga a lo largo del eje x positivo. Por lo general, es más conveniente expresar los resultados de un cálculo relativo a las vibraciones armónicas, en términos de la constante de propagación k, que en función de X propiamente

Velocidad de grupo de trenes de ondas armónicas

53

dicha. La dirección de propagación de la onda se invierte, cambiando el signo de k. Si la solución (3.1-7) se diferencia y se substituye de nuevo en la ecuación ondulatoria (3.1-6), se verá que, para satisfacer (3.1-6), w y k deben relacionarse mediante

ro= kJcfp.

(3.1-9)

La velocidad de fase de una onda es la razón de avance de un punto de fase constante a lo largo de la dirección de propagación de la onda. Para determinar la velocidad de fase, se puede examinar el movimiento de un punto de fase constante y, para mayor facilidad, se utilizará un punto de fase cero. Puesto que el ángulo de fase es wt- kx, de acuerdo con (3.1-7), la ecuación de movimiento del punto de fase cero es,

rot- kx =O o bien, (3.1-10) Como se puede ver, el punto de fase avanza a una velocidad constante de fase igual a w/k. De acuerdo con la ecuación (3.1-9), la velocidad de fase para estas ondas se puede expresar como

vP

vP =

wfk = Jcfp,

(3.1-11)

de donde, es evidente que la ecuación de onda (3.1-6) se puede escribir como sigue (3.1-12) Para este caso en particular, la velocidad de fase es independiente de la frecuencia y la longitud de onda, y sólo depende de las constantes físicas e y p, relacionadas con el medio elástico.

3.2

VELOCIDAD DE GRUPO DE TRENES DE ONDAS ARMONICAS

Ahora se investigará lo que sucede cuando se superponen dos trenes de ondas, uno de frecuencia w y constante de propagación k el otro con una frecuencia ligeramente distinta, w + dw y constante de propagación k+ dk. Para mayor facilidad, se supondrá que las amplitudes máxima de los dos trenes de ondas son idénticas, en cuyo caso, ambas amplitudes se expresan como sigúe:

u 1 =A cos (wt- kx) u 2 =A cos [(ro+ dro)t- (k+ dk)x].

(3.2-1)

La amplitud de la superposición es, entonces,

u1 + u2

= A[cos (rot- kx) + cos [(ro+ dro)t- (k+ dk)x]] = A[cos a+ cos p]. (3.2-2)

54 Dinámica de los redes cristalinas Sin embargo, tomando como base la trigonometría elemental, cos ex+ cos

p = 2 cos t(ex -

p)cos !(ex +

p),

(3.2-3)

y, de acuerdo con (3.2-2), se tiene que ex+

P=

2rot - 2kx + tdro- xdk

ex -

p=

xdk - tdro.

~

2(rot - kx),

(3.2-4)

y

(3.2-5)

En (3.2-4), los términos diferenciales tdw y xdk se pueden hacer a un lado, teniendo en cuenta que son pequeños, en comparación con los otros términos; en (3.2-5) no hay términos "grandes" y los términos diferenciales son importantes. Al substituir (3.2-4) y (3.2-5) en (3.2-2), se tiene que u1

+ u 2 = 2A cos (rot- kx) cos (tx dk- !t dro).

(3.2-6)

Esta superposición representa una onda caracterizada por los valores originales de w y k, multiplicados por una envolvente sinusoidal con una longitud de onda mucho más larga, 21T/dk, denominada "envolvente de pulsaciones", como se ilustra en la figura 3.2. Se puede examinar el movimiento de esta envolvente y, sobre todo,

2,. k

Figura 3.2.

Tren de ondas formado al superponer dos ondas sinusoidales cuyas frecuencias son

w y w +dw y con constantes de propagación de k y k +dk.

la velocidad de fase de la envolvente (correspondiente a la velocidad de los grupos o "pulsaciones", a lo largo de la dirección de propagación) determinada mediante el mismo procedimiento que se utilizó para una onda armónica simple, en la sección 3.1. La ecuación del movimiento del punto de fase cero de la envolvente es x dk - t dw

o bien,

= O,

dw x=-t=vt dk g

o

(3.2-7)

Por tanto, se ve que la envolvente o los grupos de ondas se desplazan con una velocidad dw/dk; que se denomina velocidad de grupo, v.rr, asociada con las ondas. Se puede demostrar que la velocidad con que la onda transmite energía a lo largo de la dirección de propagación es idéntica a esa velocidad de grupo. 1 Como puede 1 L. Brillouin, Wave l'ropa!!;ation in Perwdic Structures, Dover Publications, lnc., Nueva York (1953)

Movimiento ondulatorio en redes atómicas unidimensionales

SS

verse, esto es lógico desde el punto de vista físico, por ejemplo, en el tren de ondas de la figura 3.2, no puede fluir energía más allá de un nodo, ya que el medio en el punto nodal está totalmente inmóvil. Por consiguiente, la energía se debe transmitir a la velocidad a la que se mueven los nodos, es decir, a la velocidad de grupo. En el caso de una onda estacionaria, la velocidad de grupo es cero y es evidente que no puede haber un flujo neto de energía. Para las ondas elásticas en un medio homogéneo, que se estudiaron en la sección 3.1, la velocidad de fase y la de grupo son iguales, de acuerdo con la ecuación (3.1-9). Esto es cierto debido a que w es una función lineal de k, de donde, w/k y dw/dk son iguales. El mismo resultado se aplica también a las ondas electromagnéticas en vacío, dado que también en este caso, la velocidad es una constante independiente de la frecuencia y la longitud de onda. La velocidad de fase y la velocidad de grupo sólo pueden diferir cuando la primera w/k es una función de la frecuencia w, y por tanto, cuando la misma w no es una función lineal de k. Por ejemplo, esta situación se presenta cuando hay una luz que pasa por un medio en el que el índice de refracción (y, por ende, la velocidad de fase) es una función de la frecuencia; el fenómeno se conoce como dispersión y dicho medio se denomina medio dispersivo o de dispersión. Como ¡,~ verá en breve, también sucede en el caso de ondas elásticas, en un medio compuesto de átomos discretos enlazados por las fuerzas de la ley de Hooke, sobre todo cuando las longitudes de onda de que se trata no son mucho mayores que las distancias interatómicas.

3.3

MOVIMIENTO ONDULATORIO EN REDES ATOMICAS UNIDIMENSIONALES

Ahora se examinará el movimiento vibratorio longitudinal de una cadena unidimensional de átomos idénticos de masa m, que están unidos entre sí mediante fuerzas lineales, como se indica en la figura 3.3. En estado de equilibrio, los átomos estarán situados en puntos de equilibrio igualmente espaciados; pero en estado de excitación producido por el movimiento vibratorio, los átomos realizan movimientos periódicos alrededor de estas posiciones de equilibrio, en este caso, la amplitud Un representa el desplazamiento real del nésimo átomo, desde su posición de equilibrio. n-2

En reposo:

Vibrando

~a

~

+

~t Un-1

Figura 3.3.

n

n-1

a

n+2

n+l

+

~t un

a

+

a----4

~ t Un+

t

1

Geúmetría de la red lineal monoatómica de la sección 3.3.

Se supone que las fuerzas entre los átomos circunvecinos son las de la ley de Hooke, y que los átomos se comportan como si estuviesen unidos por medio de resortes ideales, suponiéndose también que las únicas interacciones de fuerzas significativas, son las que se ejercen directamente entre los átomos más cercanos. De donde la influencia directa de los átomos n + 2, N+ 3, n + 4 ... sobre el átomo n

56 Dinámica de las redes cristalinos

se considera despreciable, aunque el comportamiento del átomo n + 2, por ejemplo, puede influir indirectamente en el átomo n en el sentido de que afecta directamente al átomo n + 1 que, a su vez, actúa sobre n. De acuerdo con estas suposiciones, la fuerza neta que actúa sobre el nésimo átomo se puede expresar en términos de la extensión de dos "resortes" que lo unen a los átomos n + 1 y n - l. Así:

= {3(u.+ 1 + !1

11 _

1 -

2u,).

(3.3-1)

en donde (3 es la constante de la ley de Hooke, que expresa la proporcionalidad existente entre la fuerza requerida para producir un desplazamiento atómico y el desplazamiento propiamente dicho. De acuerdo con la segunda ley de Newton, esta fuerza se puede expresar como el producto de masa m del nésimo átomo por su aceleración, de donde, se obtiene la ecuación del movimiento

(3.3-2) Se buscan soluciones periódicas a esta ecuación y se puede esperar que tengan la forma

(3.3-3) en analogía con (3.1-7). Sin embargo, en la expresión (3.3-3) se debe representar el coeficiente de k del exponente como la coordenada x ael nésimo átomo de la cadena, es decir, na. De acuerdo con esto. se puede esperar que un+l

= Aei[wt-k(ll+l)aJ

Un-l

= Aei[wt-k(n-l)•J.

y

(3.3-4)

Si la solución (3.3-3) se diferencia dos veces con respecto al tiempo y, junto con la (3.3-4) se substituye de nuevo en la ecuación de movimiento (3.3-2), el resultado es

= 2{3(cos ka

- 1).

(3.3-5)

1 -cosO= 2 sen~ !0,

(3.3-6)

Sin embargo, dado que

esto se puede expresar en la forma 01

= ,./4fJ/m lsen-!kal.

(3.3-7)

Movimiento ondulatorio en redes atómicas unidimensionales

51

Los signos de valor absoluto se requieren en (3.3-7), por la única razón de que la frecuencia se debe considerar como una cantidad esencialmente positiva, sin importar de que k sea positiva o negativa, es decir, sin importar que la onda se propague hacia la derecha o la izquierda, a lo largo de la cadena. En consecuencia, se observa que existen soluciones de la forma (3.3-3), a condición de que w se relacione con k, mediante (3.3-7). Es obvio que, en este caso, w no es una función lineal de k, de modo que aquí se trata un medio de dispersión; una relación del tipo de (3.3-7) que presenta a w en función de k, se conoce como relación de dispersión. En la figura 3.4 se muestra una gráfica de w en función de k, como se da en (3.3-7). De acuerdo con esto (y (3.3-7)), se observará que, si se restringen los valores de k, mucho menores que rrja, y, por ende, a valores de "A que son mucho mayores que el doble de la distancia interatómica a, w es aproximadamente lineal, con k, ya que, en ese caso, sen-!- ka~-!- ka y

(3.3-8) En este límite de longitud de onda larga, la velocidad de fase será esencialmente constante, ya que

vP = wfk = aJ{3/m

= v0.

(3.3-9)

En este mismo límite, la velocidad de grupo es (3.3-10) y, por tanto, constante e igual a la velocidad de fase en esas condiciones. En consecuencia, para longitudes de onda muy largas, los efectos de dispersión son desechables y el medio se comporta como si fuera elástico, continuo y homogéneo. Por supuesto, esto es plausible desde un punto de vista físico, ya que, para este tipo de longitudes de onda largas, la naturaleza "atómica" de la cadena tiene poca importancia en lo que respecta al comportamiento dinámico del sistema. No obstante, al aumentar k, los efectos de dispersión se hacen cada vez más importantes y w deja

w(k)

_,------------~------------r--k -7T

o

Figura 3.4.

o

1T

o

Relación de dispersión de red lineal monoatómica de la sección 3.3.

58

Dinámica de las redes cristalinas

de variar en forma lineal, en función de k. En estas circunstancias, se observa que, de acuerdo con (3.3-7),

vP

!ka lsentkal

(3.3-11)

v0 leos tkal,

(3.3-12)

= wfk = v0

y v9

= dwfdk =

en donde v0 =a .Jlflm es el límite de longitud de onda larga, tanto de vP como de vg, como lo demuestran (3.3-9) y (3.3-1 0). En las figuras 3.5 y 3.6 se presentan las

gráficas de vp y Vg, como funciones de k. En la figura 3.6 se observa que vg-+ O conforme k-+ rr/a y, por tanto, conforme A-+ 2a; en este caso, la fase de vibración de los átomos adyacentes difiere en rr radianes y la naturaleza del movimiento es sencillamente una onda estacionaria. Esta condición corresponde también a la reflexión de Bragg de las vibraciones elásticas de átomos sucesivos del cristal; para esta geometría, el ángulo 8 de Bragg de la ecuación de Bragg (2.1-1) es rr /2 correspondiendo a la incidencia normal, en cuyo caso, la ecuación de Bragg se reduce a A = 2d para el primer orden de reflexión. La naturaleza física real del movimiento se ilustra en la figura 3.7, para el caso de una longitud de onda larga y para la condición A = 2a, en la que se establecen las ondas estacionarias. En estas figuras, los desplazamientos atómicos se representan como movimientos transversales, para facilitar la ilustración, aunque, por supuesto, los movimientos atómicos reales que se analizan aquí son de tipo longitudinal, en el que Vp

-6,.

o

-

o

-2,. o

-., o

o

.,.

2rr

a

o

-4rr o

-6a...

Figura 3.5. Velocidad de fase en función de la constante de propagación k, correspondiente a la red lineal monoatómica. [Tomado, con permiso, de Wave Propagation in Periodic Structures, McGraw-Hill (1946). J

Figura 3.6.

Vcloddad de grupo como una función de la constante de propagación k para la red lineal monoatórnica.

Movimiento ondulatorio en redes atómicas unidimensionales

~j

Figura 3.7.

i

59

j ¡---¡-_,__

Desplazamientos atómicos en la red monoatómica lineal (a) para una longitud de onda mucho mayor que el espaciamiento interatómico, (b) en el límite en donde 'A= 2a. Para mayor claridad, los desplazamientos se representan como transversales, pero se debe tener presente que los desplazamientos reales estudiados en este texto son longitudinales. [De acuerdo con Brillouin.]

los desplazamientos atómicos reales se efectúan a lo largo de la cadena y no en sentido normal a ésta. Como se ilustra en la figura 3.8, para cualquier valor de k en la región - rr/a
Figura 3.8.

Un solo grupo de desplazamientos atómicos representados por varias ondas sinusoidales de diferentes longitudes de onda. [Tomado de Brillouin, Wave Propagation in Periodic Structures, McGraw-Hill, Nueva York, (1946).]

con otra de k aún mayor. En otras palabras, pueden existir muchas representaciones del mismo patrón de desplazamiento átomico en el que se incluya un valor distinto de k y, en consecuencia, un valor diferente de 'A. Se puede demostrar que estas representaciones disímbolas están asociadas con diferentes periodos de la gráfica de w en función de k. Cada una de las representaciones posibles debe tener el mismo valor de w por lo que, en una gráfica de w en función de k, en la que aparezcan varios periodos de la curva, como sucede en la figura 3.9, puede haber muchos valores de k que correspondan al mismo valor de w. En la región central, que se extiende desde - rr/a hasta rr/a, se tiene sólo dos posibilidades, una onda que se propaga hacia la derecha, con la constante de propagación k 1 y otra que se desplaza hacia la izquierda, con una constan te de propagación k_ 1 = - k 1 • Las regiones marcadas en esta figura con los números 2 y 2', que con tienen otras dos soluciones posibles, k 2 y k_ 2 = - k 2 , se pueden superponer en la región central, desplazando la región 2 hacia la izquierda una distancia 2rr/a y moviendo la región 2' una distancia 2rr/a. El carácter de las soluciones posibles en la región 2 es el mismo que

60 Dinámica de las redes cristalinos

"'

Figura 3.9.

Varios periodos de la relación de dispersión para una red lineal monoatómica. Se observará que muchos valores de k se pueden asociar con cualquier frecuencia dada dentro del rango permitido.

el de las soluciones posibles de la región 1' excepto por una diferencia en los valores

k de 2rr/a; lo mismo puede afirmarse de las regiones 2' y l. Del mismo modo, las regiones 3 y 3', que contienen dos soluciones posibles para las que k = k 3 y k = k_ 3 = - k 3 , se pueden superponer sobre la región central - rr/a
u(x,t) = A sen knx sen wt

(3.3-13)

kn = nrr.JL,

(3.3-14)

con

en donde, n es un entero, satisfaría las condiciones de frontera de que el desplazamiento u en ambos extremos de la cadena en x =O y x = L, debe ser cero y, por 2 Debe hacerse notar que las velocidades de fase de ondas equivalentes en diferentes Zonas de Brillouin son distintas; pero este hecho no tiene un efecto físico directo.

Movimiento ondulatorio en redes atómicas unidimensionales

61

~ ,

Figura 3.10.

n =4

Conjunto de desplazamientos sinusoidales de una cuerda con vibración transversal, que satisfacen la condición de frontera de que el desplazamiento desaparece en ambos extremos. Estas diversas configuraciones sinusoidales se pueden considerar como modos normales para el sistema en esta condición particular de frontera.

tanto, se calificaría como modo normal de vibración del sistema. Esta situación se ilustra en la figura 3.1 O. Sin embargo, si la cadena se compone de átomos discretos, el valor máximo de k está dado por rrja, y corresponde a un valor mínimo de la longitud de onda de 2a, como se puede ver en la figura 3. 7(b ). Cualquier valor grande de k o cualquier valor pequeño de A. corresponde simplemente a una repeti· ción de cierta configuración que se puede describir mediante un valor de k dentro de la zona central. De acuerdo con (3.3-4), los valores posibles de k para un sistema de ese tipo son, k= rr/L, 2rr/L, 3rr/L, • • • rrja. No obstante, si hay N átomos en una cadena de longitud L, cada uno de los cuales está separado de su vecino por una distancia a, entonces, a= L/(N- 1) y, por tanto los valores permitidos de k para vibraciones normales de esta índole es k = rr/L, 2rr/L, 3rr/L • • • (N - 1)rr/L, dando un total de N- 1 modos. Sin embargo, para k= (N- l)rr/L, (A.= 2a) se debe excluir en este caso, dado que no se puede excitar a menos que se muevan los átomos del extremo, lo cual está prohibido por las condiciones de frontera. El número de modos reales de vibración, en estas condiciones de frontera, es, por tanto N- 2, o sea, el número de átomos de la cadena menos dos. Por supuesto, si N es un número muy grande, no importa si el número de modos normales se considera como N- 2 o, simplemente, como N. Conviene hacer notar que las condiciones físicas de frontera que se imponen al sistema son las que limitan los valores posibles de k a cierto número finito de valores, tomados del continuo de valores posibles entre - rr/a y rrja que permiten las soluciones de las ecuaciones diferenciales de movimiento del sistema. Como lo demuestra la exposición anterior, cuando los extremos de la cadena se mantienen rígidamente fijos, se seleciona un conjunto de N- 2 valores posibles de k, correspondientes a las soluciones que satisfacen esas condiciones de frontera, de entre este grupo infinito de valores posibles. Sin embargo, en cualquier problema real se deben seleccionar ciertas condiciones de frontera en las ondas elásticas y, en lo que respecta al número de modos normales posibles, se encuentra que no importa mucho cuál de los conjuntos de condiciones se escoja, siempre que sea físicamente aceptable. En cada caso, se tendrán básicamente N modos normales posibles de vibración, que satisfagan las condiciones de frontera que se hayan seleccionado, a condición de que el número de átomos N sea mucho mayor que la unidad. Se encuentra que este resultado se aplica también en sistemas bidimensionales y tridimensionales. En muchos casos, será útil seleccionar como condición de frontera, el requisito de que la amplitud de vibración del Nésimo átomo sea precisamente la misma que la del primer átomo. Desde el punto de vista físico, esto correspondería a una cadena lineal, que se dobla para obtener la forma de un anillo, en el que el Nésimo átomo se une al primero para cerrar la cadena. Las condiciones de frontera de esta naturaleza se conocen con el nombre de frontera periódica; la aplicación de estas condiciones a las soluciones (3.3-3) de las ecuaciones de movimiento, producirá el mismo

62 Dinámica de redes cristalinos resultado, a saber: que pueden existir esencialmente N soluciones de las ecuaciones de movimiento, que satisfagan también las condiciones de frontera periódicas. Más adelante, la demostración de este resultado se le asignará al lector como tarea y ejercicio.

3.4

ESTRUCTURAS DIATOMICAS UNIDIMENSIONALES

Hasta ahora el examen de las propiedades dinámicas de las redes cristalinas se ha concretado al caso en que todos los átomos de la red son idénticos. Puesto que muchos cristales comunes son compuestos diatómicos, que contienen átomos de dos especies químicas diferentes y, dado que las característic~s dinámicas de sus estructuras difieren en varias formas importantes de los cristales monoatómicos, conviene proceder al de las vibraciones elásticas en cristales de este tipo. Sea una red en la que los átomos de dos especies están dispuestos en forma alternada y cada átomo está separado de los dos átomos adyacentes por una distancia a, como se muestra en la figura 3.11. La masa del átomo ligero se representa mediante m, y la del átomo pesado es M. También aquí se aplicarán las suposiciones de la sección 3.3 en relación con las fuerzas de la ley de Hooke y sólo se tomarán en cuenta las interacciones entre los átomos adyacentes. Aquí se hace necesario escribir ecuaciones independientes para el átomo ligero y el pesado; lo cual se hace siguiendo una analogía exacta del procedimiento de la sección 3.3, teniendo como resultado

(3.4-1)

También ahora se deben buscar soluciones de la forma (const.)ei(wt-kx), representando la coordenada x del átomo, de acuerdo con su posición a lo largo de la cadena, como en (3.3-3) y (3.3-4).

m

m

M

~o-i-o~ ---- 2 n-2

Figura 3.11.

M



o

m

M

2n-l

2n

2n+l



m

o 2n+2

M



m

o

M



2n+3 ---

Geometría de la red diatómica lineal de la sección 3.4.

Puesto que Jos dos tipos de átomos tienen masas distintas, por lo normal, sus respectivas amplitudes de vibración, también, serían diferentes. Además, en este punto, no se puede f>aber que sus frecuencias son iguales -aunque, como se verá

Estructuras diatómicas unidimensionales 63 más adelante, esto es lo que sucede en este caso en particular. Por tanto, se suponen soluciones de la fórmula

y (3.4-2) Si u 2 n y u2n+i están dadas por estas expresiones, de acuerdo con la regla de que el coeficiente de k en el exponente debe representar la coordenada x del átomo en cuestión, también debe ser cierto que

(3.4-3)

Si las soluciones (3.4-2) se diferencian dos veces con respecto al tiempo y se substituyen de nuevo en las ecuaciones de movimiento (3.4-1), utilizando (3.4-3) para expresar todos los desplazamientos en términos de u 2 n y u 2 n+i, se tiene que

(3.4-4)

Al resolver la segunda de estas ecuaciones para u 2 n+i, se observa que

p(l + e-2ika> U2n+ 1

=

2 p _ Mw~

(3.4-5)

U2n·

Las ecuaciones de movimiento requieren que esta relación se satisfaga para todos los valores de tiempo. No obstante, si los valores de u 2 n y u 2 n+l tal y como los da (3.4-2), se substituyen en (3.4-5), es evidente que este requisito se puede satisfacer para todos los valores de t, sólo cuando w 1 y w 2 son iguales. De acuerdo con esto, tomando (3.4-6) y substituyendo (3.4-5) en la primera de las ecuaciones (3.4-4), expresando los exponenciales de acuerdo con las funciones trigonométricas y simplificando, es evidente que (3.4-7) Al reacomodar esta ecuación y reunir las potencias de w, se tiene, por último, 4

w -

2P(m +M) 2 mM w

+

4P 2 sen 2 ka mM

= O.

(3.4-8)

64

Dinámica de redes cristalinos

Esta ecuación cuadrática en w 2 se puede resolver fácilmente mediante la fórmula cuadrática a fin de obtener dos soluciones para w 2 , que se designarán como w~ y w~, según se escoja el signo + o el - en la fórmula cuadrática. El resultado es 2 _

c.o± -

P(m + M) [ 1± mM

J_ 1

4mM sen2 ka] ( m+ M)2 .

(3.4-9)

w(k)

l

/2~/M

1

1 1

-4--------------~--------------~k

l-..!:. 2o

Figura 3.12.

o

1

;o

Relación de dispersión correspondiente a la red diatómica lineal, donde se muestran las ramas Óptica y acústica.

En la figura 3.12 se muestra una gráfica de este resultado. En donde se pueden ver dos ramas de la curva w en función de k, una para el caso en que se tome el signo + y la otra, el signo -, en (3.4-9). La rama superior, w+(k), se conoce con el nombre de óptica, en tanto que la inferior, w_(k), se denomina la rama acústica. La importancia de esta terminología se aclarará más detalladamente a su debido tiempo. Para valores pequeños de k, sen ka:::: ka, y las dos raíces se convierten en

(3.4-10) y

w_(k)=ka

J

2p

-m+M

(ka

~

;r/2).

(3.4-11)

Para obtener la expresión (3.4-11) se debe escribir la raíz cuadrada de (3.4-9) en forma de una expansión binomial para valores pequeños del argumento. La longitud de onda más pequeña posible de la primera zona de Brillouin es dos veces la distancia de la celda unitaria de la red que, en este caso, es 2a. Esto proporciona una longitud de onda mínima de 4a, correspondiente a un valor máximo de k de Tr/2a en la frontera de la primera zona. Para este valor de k (3.4-9) da

Región de frecuencia prohibida

65

(3.4-12)

y

w_

= )l/3/M.

Las características físicas del movimiento se pueden entender mejor, observando lo que sucede cuando k~ O. En este caso, para obtener la relación de la amplitud B/A la expresión (3.4-5) es la más conveniente, siendo el resultado ,

U2n+ 1

B

!~~~=A=

2{3 2{3- Mw~

(3.4-13)

Para la rama acústica, w = w_, como se indica en (3.4-11) y conforme O, w_ ~O, de donde B/A = l. En consecuencia, para el modo acústico de vibración, los dos tipos de átomos se mueven en la misma dirección, con igual amplitud, como se muestra en la figura 3.13(a). k~

(a) Rama acústica

(b) Rama óptica Figura 3.13.

Desplazamientos físicos asociados con vibraciones de longitud de onda larga propios de (a) la rama acústica y (b) la rama Óptica.

Para 1~ rama óptica, w = w+ en (3.4-13) y utilizando (3.4-10) se ve claramente que, en este caso, B/A = - m/M. Por tanto, para la rama óptica en k= O, las vibraciones de los átomos tienen direcciones opuestas y las amplitudes, una relación inversa con las masas, de manera que el centro de la masa de la celda unitaria permanece fijo durante el periodo de movimiento, como se observa en la figura 3.13(b). Por lo general, esas características son típicas de las ramas óptica y acústica. Las vibraciones de modo óptico en cristales iónicos, donde dos tipos de átomos tienen cargas opuestas, se pueden excitar mediante un campo eléctrico que tiende a hacer que los iones se muevan en diiecciones contrarias. Sobre todo en las substancias iónicas, este modo se puede excitar mediante un campo eléctrico asociado con una onda lumínica, debido a lo cual se usa el término de vibraciones de modo óptico.

3.5

REGION DE FRECUENCIA PROHIBIDA

De acuerdo con la mencionada figura 3.1 '2, existe una banda de frecuencias < 2(3/m en la que no hay soluciones de la forma (3 4-2). Pues sucede que las frecuencias de este rango simplemente. no pueden propagarse como vibraciones armónicas continuas no amortiguadas de la red. Si se intenta excitar vibraciones de una frecuencia que queda dentro de esta banda. las vihmciones ~on at<'lllltlllas o

2(3/M < w 2

66 Dinámica de redes cristalinas amortiguadas por la propia red, dependiendo el coeficiente de atenuación de la frecuencia, las masas atómicas y la constante de fuerza. Para ver esto con mayor claridad, la ecuación (3.4-7) se puede escribir en la siguiente forma

(3.5-1) Puesto que en la regwn 2(3/M < w 2 < 2(3/m, el primer factor en la parte superior de la ecuación de (3.5-1) es positivo y negativo el segundo, es evidente que cos ka debe ser imaginario en esta región de frecuencias, por lo que ka debe ser un número complejo. Si la raíz cuadrada se escribe en la segunda forma que se indica arriba, cos ka se expresa como una cantidad imaginaria if>, en donde 6 es un número real dentro del rango de frecuencias de interés. El coseno de un número complejo se puede expresar como la suma de partes reales o imaginarias mediante un simple cálculo, utilizando el teorema de Euler como sigue: COS

Z

= COS (x

+ iy) =

COS

X

COSh y- Í sen XSenh y.

(3.5-2)

Si esto se iguala a if>, como lo requiere (3.5-1), y se igualan las partes reales e imaginarias de la ecuación resultante, se obtiene cos x cosh y = O,

(3.5-3)

sen x senh y=

(3.5-4)

-~.

En (3.5-3), coshy no es nunca cero para cualquier valor de y, de donde cos x = O y x = ± rr/2, por tanto, sen x = ± l. Al substituir este valor en (3.5-4), es obvio que

y = :¡: senh- 1 ~.

(3.5-5)

en donde, z = ka = x

7l

+ iy = ± l

+ i senh-

1

e)

(3.5-b)

y las soluciones de la ecuación de onda (3.4-2) se convierten en

(3.5-7) Estas son oscilaciones atenuadas o amortiguadas; el signo menos del exponente se debe seleccionar para los casos físicamente reales de-ondas amortiguadas (el signo m:ís representa ondas crecientes cuya amplitud aumenta exponencialmente a lo largo

Excitación óptica de vibraciones reticulares en cristales iónicos de la cadena). La constante de atenuación como

K,

67

definida al escribir la solución (3.5-7)

(3.5-8) está dada por 1

K=-

a

senh - l ó,

(3.5-9)

en donde o, a su vez, está dada por (3.5-1). Esta misma situación general predomina para valores de w que exceden w+(O), según han sido dados por (3.4-1 0), y también en el caso de la cadena monoatómica para valores de w que se sobrepasen de y4[3/m; en cada caso se encuentra que la red cristalina no puede propagar frecuencias en estos rangos y que la red misma debe amortiguar o atenuar cualquier perturbación de esta índole. Hasta ahora sólo se han visto ondas longitudinales en redes unidimensionales; sin embargo, también se pueden excitar vibracwnes transversales en las que los desplazamientos atómicos son perpendiculares a la cadena y no a lo largo de ella. Las características de estas ondas transversales son, en general, muy similares a las de las ondas longitudinales; el fenómeno de dispersión, los modos de vibración acústico y óptico para las estructuras diatómicas y las bandas de frecuencias prohibidas, se producen más o menos en la misma forma que en las ondas longitudinales. Puesto que las ondas transversales implican desplazamientos atómicos normales a los que tienen lugar en las vibraciones longitudinales, las ondas transversales y longitudinales se pueden excitar en forma simultánea (como primera aproximación) e independientemente entre sí. De igual manera, puesto que existen dos direcciones posibles de desplazamiento ortogonal e independiente para las ondas transversales, se pueden excitar de un modo simultáneo dos oscilaciones transversales independientes.

3.6

EXCITACION OPTICA DE VIBRACIONES RETICULARES EN CRISTALES IONICOS

En un cristal iónico, por ejemplo, el de NaCl, los átomos de sodio y cloro están ionizados; el átomo de sodio lleva una carga e y el de cloro una carga -e. En estos cristales, el vector eléctrico de una onda lumínica puede excitar vibraciones de un modo óptico, ya que un campo eléctrico ejerce fuerza sobre las cargas positiva y negativa que tienen direcciones opuestas. En esta exposición, se supondrá que se trata de redes diatómicas lineales de átomos de cargas opuestas que se extienden a lo largo de la dirección x y que la luz incide perpendicularmente a la cadena atómica, de tal modo que el vector eléctrico de la onda oscila a lo largo del eje x. En estas condiciones, en cualquier instante dado, todos los átomos del cristal están sometidos al mismo campo eléctrico, y sobre los iones adyacentes, positivos y negativos, se ejercen fuerzas exactamente iguales, pero opuestas. El efecto que produce un campo de excitación de esta naturaleza consistirá en establecer vibraciones longitudinales forzadas en la red cristalina, a la frecuencia de la fuente de excitación, es decir, la onda de luz incidente. Puesto que el campo eléctrico es idéntico en todas las partes de la red, en un momento dado, el tipo de vibración que se excitará será el de la figura 3.13(b), o sea, una vibración óptica de una longitud de onda infinitamente larga, en la que k = O.

68 Dinámica de redes cristalinas En presencia de este tipo de campos, la fuerza ejercida sobre un ion positivo es eE0 eíwot y en el ion negativo, -eE0 eiwot, en donde w 0 es la frecuencia de la luz y E 0 es la magnitud del vector eléctrico de la onda de luz. De acuerdo con esto, se debe agregar un término de fuerza eE0 eiwot al lado derecho de la primera ecuación de movimiento (3.4-1) y el término - eE0 eiwot al segundo. Si ahora se suponen soluciones de la forma

u 2n+ 1 = Bei(coor-[2n+ 1JkaJ

(3.6-1)

Las vibraciones que se han supuesto a la frecuencia de fuerza y, si se repiten los pasos que llevan a las ecuaciones (3.4-4), se obtiene - mw~u2n = p[(l

-

+ éika)u2n+ 1 -

+ eE0 eiwot 2 R[(l +e - 2ika) U2n- 2U2n+1 J -eE oeiwot· M WoU2n+1=P 2u2nJ

(3.6-2)

Puesto que desde el punto de vista físico la vibración óptica que se excita por medio de la onda de luz es tal que k= O, el conjunto de ecuaciones anteriores se reduce a

(2P- mw~)u 2 n- 2Pu2n+1 = eEoeiwor -2Pu2n

+ (2P- Mw~)u2n+1 =

(3.6-3)

-eEoeiwor.

Este grupo de ecuaciones simultáneas se puede resolver para las amplitudes de vibración u 2 n y u 2 n+l, y el resultado es - (- eEo/m) iwor U2n- Wo2 w+2(0)e

(3.6-4) U2n+ 1

_ -

(eEo/M) iw 0 t, w 02 -w+2 (O) e

en donde w+{O) es el límite de longitud de onda larga de la frecuencia de rama óptica, como está dado por (3.4-10). De acuerdo con estos resultados, cuando la frecuencia de la luz incidente es igual a la frecuencia natural de la red para vibraciones de modo óptico de longitud de onda larga, w+{O), por lo normal, se observaría un efecto de resonancia ya que las amplitudes de vibración aumentarían mucho. Es de esperarse que al producirse la resonancia, las amplitudes muy grandes de vibración de los iones cargados den origen a una fuerte rerradiación de energía electromagnética a la frecuencia resonante. De hecho, este fenómeno se observa en cristales iónicos en los que se produce un solo pico fuerte en la reflexividad óptica del cristal en la región infrarroja lejana del espectro, sobre todo en la región de 40 a 1OOJ.L de longitud de onda. Si se conocen las constantes de elasticidad del cristal, se puede hacer un cálculo de la constante de fuerza {3; sí luego se conocen las masas atómicas m· y M, se puede calcular y comparar la frecuencia de resonancia w+(O) según la predice (3.4-1 O), con la frecuencia óptica a la que se observa experimentalmente la máxima reflexividad. De esta manera se encuentra que en la mayoría de los cristales iónicos simples, los dos valores concuerdan con bastante exactitud.

Energía de enlace de estructuras cristalims iónicos 69 Si un cristal iónico dado refleja varias veces la radiación de una fuente infrarroja de espectro continuo, la radiación residual resultante será una luz casi monocromática de la frecuencia de resonancia de la red, ya que a otras frecuencias, la reflexividad del cristal será más bien pequeña y, después de varias reducciones, este tipo de luz se atenuará enormemente. Este efecto ha llevado a la terminología de rayos residuales o bien, como se dice en alemán, Reststrahlen, refiriéndose a la radiación reflejada desde un cristal iónico al pico de reflexividad. El efecto característico de Reststrahl, según se produzca o no, puede indicar si el cristal es iónico o bien covalente, ya que el modo de vibraciones ópticas no se puede excitar así en un cristal covalente, eP el que los átomos no llevan una carga neta. La intensidad del pico de Reststrahl en un cristal mixto iónico-covalente, también proporciona una estimación cuantitativa de la fuerza relativa del componente iónico del enlace del cristal. Por supuesto, en relación con el pico de reflexividad, se tiene un mínimo en la transmisión óptica del cristal. Aunque en el cálculo sencillo que se hizo se pasaron por alto los términos de amortiguamiento en la ecuación del movimiento, y no se incluyó ningún otro para explicar las pérdidas de energía del cristal, en realidad, sí se registra una pérdida de energía. Esta pérdida se debe no sólo a la rerradiación del haz reflejado, sino también a otras razones entre las cuales la más importante es la de la inarmonía de las vibraciones reticulares que se origina a las amplitudes grandes, producidas cerca de la resonancia, originando, a su vez, la excitación de otros modos de vibración de la estructura reticular.

3.7

ENERGIA DE ENLACE DE ESTRUCTURAS CRISTALINAS IONICAS3

En un cristal iónico, las fuerzas que mantienen unido el cristal se ongman principalmente en interacciones electrostáticas simples entre los iones positivos y negativos del cristal. Para este tipo de enlace, es bastante sencillo calcular la energía de enlace de la red cristalina sobre una base semiempírica. El planteamiento original de este tema se debe a Madelung y Born. 4 ,S,6 A continuación se verá el ejemplo específico de un cristal de la estructura del NaCl, como se ilustra en la figura l. 7(a); U¡¡ es la energía potencial de interacción entre los iones i y j del cristal. El total de energía de interacción entre el ion i y todos los demás iones del cristal es, entonces, (3.7-1) La prima de la suma indica que el término para el que j = i se debe excluir de la suma, ya que evidentemente, no existe una interacción de enlace entre el ion i y él mismo. Además de la energía coulómbica de interacción ± e2 jr¡¡, en donde r¡¡ es la distancia entre los iones i y j, se debe suponer q•1e existe una fuerza de repulsión la cual crece sólo en distancias interiónicas muy pequeñas. En efecto, esta fuerza de repulsión de corto alcance se origina debido a que cuando los átomos están cerca, 3 Esta sección sigue, en forma general, el planteamiento que le dio C. Kittel en IT'troduction to Solid State Physics, John Wiley & Sons, Nueva York (1956). 4 E. Madelung, Physik, Zeitschr, 11, 898 (1910). S M. Born, Atomtheorie des Festen Zustandes, Teubner, Leipzig (1923). 6 M. Born y M. Goppert-Mayer, Handbuch der Physik, 24/2, 623 (1933).

70 Dinámica de redes cristalinas resisten cualquier intento adicional para obligarlos a ocupar el mismo espacio. Si no existiera esta fuerza, el cristal tendría siempre una energía coulómbica de atracción neta entre iones de cargas opuestas, que sería mayor que la energía coulómbica de repulsión entre iones de cargas iguales, y el cristal simplemente se derrumbaría reduciéndose a un volumen igual a cero. La energía de interacción entre los iones i y j debida a esta fuerza, se representa empíricamente mediante el término A/1/¡. Si el exponente n es un número razonablemente grande, esta interacción de repulsión será muy pequeña a grandes distancias y se hará apreciable sólo en espaciamientos interatómicos bastante reducidos. La energía total de interacción entre los dos iones i y j, se puede expresar como la suma de las interacciones de repulsión de Coulomb y de corto alcance, en la forma

(3.7-2) Se debe observar que la fuerza originada en la interacción de repulsión a corto alcance, está dada por la derivada negativa de la energía de interacción correspondiente con respecto a r¡¡, nA/1¡}+ 1 • En (3.7-2) el signo + se aplica a interacciones entre iones de signos iguales y el signo - se refiere a las interacciones entre iones de cargas opuestas. La constante A se limita a expresar la proporcionalidad entre la energía de repulsión a corto alcance y rij 11 • Si el cristal se considera como un elemento compuesto de N iones positivos y N iones negativos, la energía total de enlace de la red, U, se puede expresar como sigue: U=NU;.

(3.7-3)

Ahora bien, el número total de iones del cristal es 2N, pero, al determinar la energía total de enlace, sólo debe tomarse una vez la energía aportada por cada par de interacciones ij; si se escribiera (3.7-3) con un factor de 2 en el lado derecho, las interacciones U¡¡ y U¡¡ de (3.7-1) se hubieran contado erróneamente como si fueran entidades independientes. La energía U¡¡ dada por (3. 7-2), viene a ser la suma de la energía necesaria para separar los iones i y j situados a una distancia inicial r¡¡, hasta que estén infinitamente separados; la energía reticular total U es, entonces, la energía requerida para convertir un cristal cuyos átomos vecinos más cercanos se encuentran inicialmente a una distancia r, en iones separados, cada uno de los cuales está infinitamente lejos de los demás. Si ahora las cantidades X¡¡ que no tienen dimensiones se definen en tal forma que

(3.7-4) en donde r es la distancia entre los átomos adyacentes del cristal, entonces, (3. 7-2) se puede expresar como sigue:

(3.7-5) y

(3.7-6)

Energía de enlace de estructuras cristalinas iónicas

71

No obstante, en (3.7-6), r es ahora independiente del índice de suma j, por lo que

A , 1 e2 1 U-(r) = -"" ""'1 n¿ - n+¿ ' X¡i

r

(3.7-7)

B r"

ae 2

(3.7-8)

r

i

i

xii

que se puede escribir así: U-(r)=....!! _ _

'

con

B" = A L'

1/x'&

(3.7-9)

= L.' + 1/xii.

(3.7-10)

j

y a

r '

j

En la figura 3.14 se muestra una gráfica de la relación (3.7-8), dando a U¡ como una función de la distancia al átomo más cercano r. Si la distancia entre los

U; (r)

r =o

(Separación del ion en equilibrio)

7::7 :;."

:í' '/' U; (o)+--........::~_.,1

(Energía de enlace)

1 1

/

Energía de Coulomb- ae 2/r

1 Figura 3.14.

Energía potencial de un ion de un cristal iónico en función de la distancia interatómica r. El cristal está en equilibrio cuando dicha energía está en un mínimo, o sea cuando existe una separación interatómica igual a la distancia reticular de equilibrio a.

átomos adyacentes es grande, la repulsión de alcance corto se puede omitir y la energía de enlace es esencialmente el exceso de la energía coulómbica de atracción, que se acerca a cero conforme r tiende a infinito. A distancias más cortas, la energía positiva de repulsión de corto alcance adquiere importancia y sobrepasa la energía negativa de Coulomb, aumentando con gran rapidez conforme disminuye r. Existe

72

Dinámica de redes cristalinos

una posición de energía mínima para el sistema, como lo indica el diagrama, y este punto representa la posición de equilibrio del cristal. El valor de r asociado con este punto es, sencillamente, la distancia interatómica de equilibrio a del vecino más cercano. En este punto, la fuerza coulómbica de atracción entre los iones mantiene un difícil equilibrio debido a la repulsión de corto alcance, siendo igual a cero la fuerza neta ejercida sobre un átomo, dada por - au;;ar. La constante a de la ecuación (3.7-8) que se denomina constante de Madelung, es un número que está determinado completamente por la estructura reticular del cristal. La constante B depende del coeficiente de energía de repulsión A, así como de la estructura reticular. Sin embargo, se puede determinar en términos de la distancia de equilibrio a del vecino más cercano. Para hacer esto, se debe evaluar la derivada de U;(r), a r =a que, de acuerdo con la exposición anterior, debe ser igual a cero, ya que el punto mínimo de la curva de energía potencial se produce a r = a Por tanto, se tiene que

nBn - n:tr a

cxe 2

+ -a2 = O,

de donde,

(3.7-11) Al substituir este valor de Bn en (3. 7-8), si se usa (3. 7-3) se encontrará que para la energía total de enlace en equilibrio, U0

= NU¡(a) =

1)

2

- -Ncxe a - ( 1- ~ .

(3. 7-12)

En esta fórmula no se conoce inicialmente a o n. No obstante, en principio, se puede calcular a evaluando la suma (3. 7-10) en todos los átomos del cristal. En esta ecuación, el signo superior se refiere a las interacciones entre cargas iguales y el signo inferior, a las interacciones entre cargas opuestas. Por tanto, si el origen se escoge como un punto de ion negativo, el signo positivo de (3.7-10) corresponderá a las interacciones con iones positivos y el signo negativo a las interacciones con iones negativos. Para una cadena unidimensional de átomos cargados, alternados, en donde, cada átomo está separado de sus vecinos por una distancia a, se tiene que, al escoger un ion negativo como origen y al usar (3.7-10),

(3.7-13)

El factor 2 es necesario porque las cantidades aportadas por los átomos a la izquierda del origen y por los átomos a la derecha del mismo, se deben incluir igualmente en la suma. De acuerdo con la expansión de serie,

In (1

+ x) = -x-

x2

-

2

x3

x4

+--+ ··· 3 4

la serie de (3.7-13) se puede obtener haciendo que x

ex= 2ln 2.

= l,

(3.7-14)

de donde, para este caso,

(3.7-15)

Energía de enlace de estructuras cristalinas iónicas 73 La evaluación de la constante de Madelung resulta un ejercicio fácil para este ejemplo sencillo. Sin embargo, cuando estos mismos métodos se aplican a estructuras cristalinas reales de tipo tridimensional, se descubre que la suma converge en forma tan lenta que es muy difícil evaluar a directamente en esta forma. Resulta ilustrativo escribir la suma de Madelung para los vecinos más cercanos, los que le siguen en segundo lugar, en tercero, etc., para la estructura del NaCl, con el fin de demostrar la naturaleza de estas dificultades de convergencia. Existen varios patrones matemáticos que se pueden utilizar para contrarrestar estas dificultades, el mejor de los cuales ha sido creado por Evjen 7 y Ewald. 8 En esta obra no se entrará en los detalles de estos métodos, sino que sólo se mencionarán los resultados correspondientes a algunas estructuras de interés. Se ha encontrado que para la estructura de NaCl oc= 1.7476 estructura de CsCl 1.7627 estructura de la zincblenda 1.6381 La tendencia de los compuestos iónicos a cristalizar en estructuras que poseen constantes de Madelung grandes es por demás conocida. Esto se debe a que un valor máximo de a, de acuerdo con (3.7-12), minimiza la energía del sistema dando un cristal con la máxima energía de enlace (negativa). En consecuencia, los cristales muy iónicos raramente cristalizan en estructuras como la de la zincblenda. La constante n de (3. 7-12), que es en realidad el exponente asociado con el potencial de repulsión a corto alcance, se puede expresar en términos de la compresibilidad adiabática del cristal, que se puede medir en forma experimental. Para hacer esto, se puede comenzar con la Primera Ley de Termodinámica que establece que

dQ

= dU + p dV = T

dS,

(3.7-16)

en donde los símbolos tienen su significado termodinámico acostumbrado. Se considera que la energía interna U se compone totalmente de la energía potencial de interacción entre los iones del cristal, según se expresa en (3.7-12). Esto significa que se supone que la temperatura es mucho menor que la de fusión en una escala absoluta, ya que al aumentar la temperatura, los iones adquieren, además de su energía potencial, cada vez más energía cinética de vibración, que al llegar al punto de fusión excede la energía potencial de interacción entre los iones y con ello se destruye la estabilidad de la estructura reticular. En el caso de un proceso adiabático, dQ = O, en donde dS = O y dU = - p dV, dando p = -(dU)

dV

y

(3.7-17)

S

La compresibilidad adiabática (compresibilidad medida en tales condiciones que no se intercambie calor con el medio), se puede definir como K=_.!._ (dV) V dp .'

7

8

H. M. Evjen, Phys. Rev. 39, 675 (1932). P. P. Ewald, Ann.d.Physik 64, 253 (1921).

(3.7-18)

74

Dinámica de redes cristalinas

en cuyo caso, de acuerdo con (3.7-17),

.!.= -v(dp) =v(dz~)K

dV •

dV



(3.7-19)

De igual manera, dU dU dr dV=drdV y

_ dU d 2 r - dr dV 2

+

(!!!:) dV

2

d2 U dr 2 •

(3.7-20)

.

Sin embargo, el volumen de la celda unitaria de NaCl, con 4 átomos de Na y 4 átomos de Cl, como se ilustra en la figura 1.7(a), es 8r3 ; el volumen por átomo de Na (o por átomo de Cl) es, por tanto, 2r 3 , y el volumen total de un cristal grande con N iones de Na y N iones de Cl, será (3.7-21)

de donde, dr 1 dV = 6Nr 2

(3.7-22)

y

(3.7-23)

De acuerdo con (3.7-20), (3.7-22) y (3.7-23), se tiene que d2U -1 dU 2 dV = 18N 2 r 5 dr

1

+

36N 2 r4

d2U dr 2 '

(3.7-24)

Como ya se vio antes, dU/dr =O a r =a, por tanto, de acuerdo con (3.7-24), se de be tener (3.7-25)

de donde, recordando (3.7-19) (3.7-26)

Energía de enlace de estructuras cristalinas iónicas

15

A partir de (3.7-8), U(r) se puede expresar como sigue: B U(r) = NU¡(r) = N [ ;

2

a.e ] ---¡: ,

(3.7-27)

en donde, (3.7-28)

Bn está dada por (3.7-11). Al substituir Bn de la última ecuación, en (3.7-28), y simplificando, haciendo que r =a, se obtiene finalmente, Na.é(n- 1) 18Na a3 =~·

(3.7-29)

de donde, resolviendo para n,

18a 4 n = l + - -2 • Ka.e

(3.7-30)

Para el NaCl, el valor medido de la compresibilidad adiabática k, es aproximadamente 4 x I0- 12 cm 2 /dina, en tanto que a= 2.8 x I0- 8 cm. Cuando se substituyen estos valores en la expresión (3. 7-30), se obtiene el resultado n e:: 8, por lo que en este caso, de acuerdo con (3.7-12), se debe esperar que U0 e:: -0.9Nae 2 ja. Entonces, parecería que aproximadamente el 90 por ciento de la energía de enlace de la red está representado por el primer término de (3.7-12), que simboliza el exceso de energía de atracción coulómbica entre iones de cargas opuestas, en relación con la energía de repulsión de Coulomb entre iones de cargas iguales, en tanto que el segundo término, que representa la parte aportada de repulsión a corto alcance, constituye sólo aproximadamente el 1O por ciento del total. El hecho de que n resulta ser un número bastante grande, coincide con las suposiciones originales relacionadas a la forma del potencial de repulsión a corto alcance y, en efecto, sirve para validar hasta cierto punto dichas suposiciones. La energía de cohesión de casi todos los cristales altamente iónicos de tipo I-VII calculados así a partir de (3.7-12) y (3.7-30), concuerdan muy bien con los valores determinados de un modo experimental, como se indica en la tabla 3.1. 9 Esta coincidencia con el experimento no es tan buena en el caso de los compuestos completamente iónicos II-VI, como podría esperarse. Se debe tener en cuenta el hecho de que estos cálculos son, hasta cierto grado, empíricos, y que relacionan un conjunto de cantidades determinadas en forma experimental (espaciamientos reticulares y compresibilidad) con otras (exponentes del potencial de repulsión y energía de enlace). Un cálculo verdaderamente fundamental de la energ:a de enlace del cristal, se etectuará a partir del conocimiento de las propiedades mecánicas ondulatorias de los iones positivos y negativos, y predeciría más que utilizaría, los valores de la constante de red y las compresibilidades; las únicas cantidades medidas que aparecerían en una formulación de esta clase serían e, m, h, etc. Lowdin 10 llevó a cabo 9 Los valores aquí citados fueron tomados de F. Seítz, Modern Theory of Solids, McGrawHill, Nueva York (1940), tablas XXIV y XXVI, páginas 80-83. 10

P. Lowdin, Ark.Mat. Astron. Fysik 35A, Nos. 9, 30 (1947).

76 Dinámico de redes cristalinas TABLA 3.1. Energías de enlace teóricas y experimentales de cristales iónicos

Substancia

Uo (cale.) kcal./mol

U0 (exp.) Exponente kcal./mol de repulsión, n

LiCI NaCI KCI RbCI CsCI

193.3 180.4 164.4 158.9 148.9

198.1 182.8 164.4 160.5 155.1

7.0 8.0 9.0 9.5 10.5

NaBr KBr N al KI Rbl

171.7 157.8 160.8 149.0 144.2

173.3 156.2 166.4 151.5 149.0

8.5 9.5 9.5 10.5 11.0

ZnS (Zincblenda) ZnSe PbS PbSe

819.0 790.0 705.0 684.0

851.0 845.0 731.0 735.0

9.0 9.5 10.5 11.0

cálculos de este tipo, cuyos resultados concuerdan bastante con el experimento. Sin embargo, el análisis detallado de este tema está fuera del alcance de esta obra. A pesar de todo, la teoría más sencilla de Born-Madelung tiene un valor considerable, debido a que verifica el simple modelo conceptual del enlace iónico con el que principiamos y porque permite que se entienda con facilidad el papel que desempeñan las fuerzas de repulsión Coulomb y de corto alcance en la determinación de la energía de enlace en las substancias iónicas.

EJERCICIOS l. Para la red lineal monoatómica de la sección 3.3, encuentre el coeficiente de atenuación de ondas de frecuencias mayores que Y4fJ!m. 2. Derive la ecuación de movimiento para ondas transversales en la red monoatómica lineal de la sección 3.3. Compare sus resultados con la ecuación de movimiento para ondas longitudinales. 3. Determine la velocidad de fase y la de grupo para ondas de las ramas óptica y acústica, para la red diatómica de la sección 3.4. Grafique sus resultados en función de k. 4. La red de la zincblenda se puede considerar como una serie de planos (111) con espaciamiento alternado a, a/3, a, a/3, a, a/3, • • • , en donde a es 1/4 del lado de una celda unitaria cúbica. Cada plano contiene átomos de un solo tipo, de modo que los espacios atómicos en planos sucesivos son alternados: Zn, S, Zn, S, Zn, • • • . Los planos se mantienen unidos alternativamente mediante un enlace covalente por átomo, normal al plano (111), y 3 enlaces de este tipo por átomo a un ángulo con la dirección [111] cuyo coseno es 1/3, de tal modo que se utiliza la misma cantidad de fuerza por unidad de desplazamiento para estirar un solo enlace o un sistema de tres enlaces dispuestos a este ángulo, cuando un átomo se desplaza a lo largo de la dirección angular [111]. Estudie la red diatómica del tipo que se ilustra en la figura que sigue, con una constante de fuerza {3 que es la misma para cualquier desplazamiento, y luego defina y resuelva las ecuaciones de movimiento para ondas longitudinales en la dirección (111) en la zincblenda, y grafique la relación resultante de w en función de k en la primera Zona Brillouin. ¿Cuál es el borde de esta primera zona? Nota: para la zincblenda, b =a/3, m =/=M en la fJ.gura antcri'-;r.

Energía de enlace de estructuras cristalinas iónicas m Zn-3

2n-2 2n-l

M

tf

2n 2n+l

m

11

M

tt

2n+2 2n+3

5. Resuelva el problema 4 para obtener las relaciones de w en función de k para ondas longitudinales en la dirección [111] para la red de diamante. Diga si el hecho de que el diamante sólo tiene átomos de una especie es la causa de que no existe una rama "óptica" para esta estructura. Sin entrar en detalles compare resultados obtenidos con los del problema 4. 6. Si el coeficiente de rigidez elástica e para NaCl es 5 X 1011 dinas/cm2, encuentre la constan te de fuerza {j y calcule la frecuencia de Reststrahl de este cristal. 7. Suponga que las vibraciones longitudinales de una cadena lineal de N átomos idénticos, se limitan a obedecer las condiciones periódicas de frontera, de tal manera que el movimiento del primero y el último átomos es idéntico. Encuentre el número de modos normales de vibración para este sistema. 8. Determine la constante de Madelung para la cadena lineal del problema 4, suponiendo que los átomos de masa m tienen carga positiva y los de masa M tienen la misma carga; pero negativa. 9. Suponga que un fluido isotrópico homogéneo con una constante dieléctrica K, se derrama en los espacios interatómicos de un cristal iónico, de tal manera que la interacción coulómbica se reduce por un factor de 1/K. Suponiendo que el potencial de repulsión de corto alcance no varía, calcule el nuevo espaciamiento reticular y la nueva energía de enlace en términos de la energía de enlace y el espaciamiento antiguos. 10. Analice las características de reflexión óptica de Ge, CdS, KBr y GaAs en la región infrarroja lejana del espectro. Finalmente explique sus predicciones desde el punto de vista de la física. 11. La imposición de condiciones periódicas de frontera a una cadena unidimensional de átomos, corresponde físicamente al caso en que el principio y el fin de la cadena se unen para formar un anillo continuo de átomos. ¿A qué sistema físico corresponde una red cuadrada bidimensional de átomos que obedecen a condiciones periódicas de frontera en los bordes opuestos de la red? Explique el significado topológico de una red cúbica tridimendional que obedece a condiciones periódicas de frontera en las caras opuestas de la muestra.

LECTURAS RECOMENDADAS M. Born y M. Goppert-Mayer, Handbuch der Physik, Vol. 24/2, J. Springer Verlag, Berlín (1933), p. 623. M. Born y K. Huang, Dynamical Theory of Crystal Lattices, Oxford University Press, Oxford (1956). L. Brillouin, Wave Propagation in Periodic Structures, Dover Publications, Nueva York (1953). C. Kittel, Introduction to So/id State Physics, 2.a edición, John Wiley & Sons, Nueva York (1956), capítulo 3. F. Seitz, Modern Theory of Solids, McGraw-Hill Book Co., Inc., Nueva York (1940), capítulo 2. R. A. Smith, Wave Mechanics of Crystalline Solids, Chapman & Hall, Ltd., Londres (1961), capítulo 3. J. M. Ziman, Electrons and Phonons, Oxford University Press, Nueva York (1960), capítulos 1 y 3.

CAPITULO

4

Mecánica cuántica. Generalidades 4.1

INTRODUCCION

Durante los últimos años del siglo diecinueve y los primeros del presente, los científicos se encontraron con un gran número de hechos observados en su experimentos que no se podían explicar debidamente basándose en la mecánica y la electrodinámica clásicas. Entre los fenómenos poco comprendidos se incluían algunas de las propiedades térmicas y eléctricas fundamentales de los sólidos. Por ejemplo, el hecho de que algunos sólidos son muy buenos aisladores, con resistividades específicas mayores de 10 12 ohm-cm, y otros son conductores excelentes con resistividades del orden de 10- 5 ohm-cm, no se podía explicar en absoluto desde el punto de vista de la teoría clásic.-. Sin embargo, a partir de 1901 gracias a la explicación dada por Max Planck sobre la distribución espectral de radiación proveniente de cuerpos calientes incandescentes, se pudo demostrar que casi todos estos resultados experimentales hasta entonces inexplicables, demostraron estar de acuerdo con las predicciones de una nueva mecánica la cual difiere en muchos aspectos importantes de la mecánica newtoniana, aunque concuerda con ella en el límite en que las masas y las energías de las partículas se hacen relativamente grandes. Esta nueva y ampliada forma de la mecánica, que resultó especialmente útil en la descripción de acontecimientos que se desarrollan a una escala atómica, se denominó mecánica cuántica. Aunque es imposible presentar en esta obra una relación extensa sobre el tema, se analizarán algunos de sus aspectos más importantes, a fin de proporcionar al lector los conocimientos necesarios para resolver problemas dinámicos simples desde el punto de vista de la mecánica cuántica, y para apreciar los resultados de los cálculos concernientes a sistemas más complejos que se dan más adelante, al explicar el comportamiento físico de cristales reales.

4.2

RADIACION DEL CUERPO NEGRO

En la figura 4.1 se ilustra la distribución espectral de la intensidad de radiacwn emitida por un radiador incandescente ideal, llamado "cuerpo negro" detemlinada experimentalmente. Hacia fines del siglo pasado, se realizaron varios intentos para explicar estos resultados a base de la mecánica clásica y la teoría electromagnética, tratando al campo de radiación como si fuera un fluido con propiedades

79

80 Mecánica cuántica. Generalidades termodinámicas tales como temperatura, presión, entropía, etc., que se determinaban mediante las leyes de la electrodinámica y la termodinámica clásicas Se supuso que este fluido estaba en equilibrio con los átomos de la substancia radiante y éstos se consideraban como osciladores armónicos dásicos. Ninguno de estos intentos tuvo éxito para describir la parte de las curvas, correspondiente a longitudes de onda corta, aunque se obtuvieron coincidencias aceptables con los datos experimentales en el límite o sea, para las longitudes de onda largas (la Ley de Rayleigh-Jeans). Los cálculos clásicos que se basaron siempre en la idea de que los osciladores atómicos podían absorber o emitir continuamente energía en cualquier cantidad, grande o pequeña, predijeron invariablemente intensidades espectrales infinitas en el límite de las longitudes de onda corta. Esto dio como resultado la emisión de una energía de radiación total infinita por unidad de tiempo, lo cual constituye un resultado obviamente absurdo. 3000 °K

I(X)

o

1

2

3

x (micrones) Figura 4.1.

Representación esquemática de la distribución de frecuencia de la radiación emitida por un radiador incandescente ideal o "cuerpo negro" a varios valores diferentes de temperatura.

En 1901, Max Planck logró explicar la forma de las .curvas de intensidad de radiación espectral correspondientes a la radiación de un cuerpo negro, formulando la hipótesis de que los osciladores atómicos podían radiar o absorber energía sólo en paquetes o grupos discretos (denominados fotones) cuya energía está dada por

e= hv

= nw,

(4.2-1)

en donde,

n = hj2n.

(4.2-2)

En este caso, v es la frecuencia del oscilador (o de la radiación absorbida o emitida), w = 2nv, y h es la constante atóm1ca universal (constante de Planck) de magnitud

h = 6.625 x 10- 27 erg-sec

n = hj2n = 1.054 X

10- 27 erg-sec.

Efecto fotoeléctrico

81

Así pues, se supone que los osciladores poseen sólo ciertos estados de energía permisibles de una energía total O, líw, 2líw, 3líw, • • • nlíw, • • • , en donde las transiciones entre estos estados permisibles se efectúan mediante la absorción o emisión de fotones cuya energía es líw. A ciertos científicos de esa época, la hipótesis cuántica les pareció muy extraña, ya que estaban acostumbrados a las ideas de la mecánica clásica; pero la coincidencia que se obtuvo a partir de entonces con los datos experimentales fue excelente y el valor de h que usó Planck para lograr que su teoría concordara con los datos experimentales (6.55 x I0- 27 erg-seg), es solamente uno por ciento menor del valor que en la actualidad se acepta como correcto. Además, es muy importante observar que los éxitos subsecuentes de la teoría cuántica para explicar fenómenos muy diferentes, no dejaron ninguna duda respecto a su validez esencial. A la luz de los conocimientos actuales, no es difícil aceptar el hecho de que la energía, al igual que la materia, puede estar compuesta de partículas discretas e indivisibles.

4.3

EFECTO FOTOELECTRICO

Cuando se deja que la luz caiga sobre la superficie de un metal, éste puede expulsar electrones hacia un vacío, en donde los puede recoger un ánodo, como se ilustra en la figma 2.4(a). La máxima energía inicial de estos fotoelectrones emitidos se puede medir insertando un rejilla entre el fotocátodo y el ánodo, y determinando el potencial retardador que se debe aplicar entre la rejilla y el cátodo para reducir la fotocorrriente a cero, como se indica en la figura 4.2{b). Se puede demostrar en esta forma que, si la luz incidente tiene una frecuencia menor que la de una frecuencia de umbral dada (¡Jo, no se produce ningún efecto fotoeléctrico en absoluto, sea cual fuere la intensidad de la luz. Para una radiación incidente de una frecuencia mayor que w 0 , los fotoelectrones se· emiten en una can ti dad proporcional

Luz

Anodo colector

+

Foto corriente Iluminación interna

Fotocátodo metálico

Iluminación leve Potencial de rejilla

(o) Figura 4.2.

( b)

(a) Diagrama esquemático del aparato usado para estudiar los efectos fotoeléctricos en los metaies, (b) una gráfica de la fotocorriente observada en función del potencial retardador para varios niveles de intensidad de la luz incidente.

82 Mecánico cuántico. Generalidades a la intensidad de la iluminación incidente, haciendo que fluya en el circuito externo una fotocorriente proporcional a la intensidad de la luz. La máxima energía inicial de estos electrones, medida por el método del potencial retardador, es estrictamente proporcional a w- w 0 , en donde w es la frecuencia de la luz incidente. La existencia de la frecuencia de umbral no se puede explicar a base de la física clásica, y no fue sino hasta después de 1905, cuando Einstein describió la naturaleza física del efecto fotoeléctrico basándose en la hipótesis cuántica de Planck. De acuerdo con la explicación de Einstein, los electrones que están dentro del metal deben poseer una energía potencial menor que la de los electrones que están en reposo dentro del vacío, fuera de la superficie metálica; de lo contrario, el metal podría emitirlos espontáneamente en la obscuridad. Este hecho lleva al cuadro conceptual de un metal tal como se ilustra en la figura 4.3. Para que los electrones del metal puedan convertirse en fotoelectrones, deben superar una barrera de energía potencial de una magnitud de por lo menos ecp 0 • El potencial cp0 , denominado función de trabajo en vacío, es una propiedad característica del material del cátodo emisor. De acuerdo con las ideas cuánticas de Planck, la absorción de un fotón cuya energía es menor que ecp 0 por parte del metal, no puede excitar a un electrón hacia el vacío, sino que sólo le imparte cierta energía cinética que finalmente se disipará dentro del metal en la forma de calor por medio de colisiones. Por otro lado, si el fotón absorbido tiene una energía ecp 0 , puede excitar un fotoelectrón hacia el vacío con una energía cinética cero y, si la energía del fotón

\

Frecuencia incidente del fotón "'o' etf>0 111 Energía

f _ ___,

Fotoelectrón emitido al vacío con un E.C. cero

e
_L~~~~~~~~ Electrones

Vacío Figura 4.3.

Vacío

Metal

Modelo conceptual simplificado de un metal, representado como un pozo de po· tencial que contiene electrones libres y en el que se basa la teoría de Einstein sobre los efectos fotoeléctricos.

es mayor que ecp 0 , puede excitar a un fotoelectrón hacia el vacío con un exceso de energía cinética que puede ser de la magnitud hw - ecp 0 , siendo hw la energía del fotón incidente. La máxima energía de los fotoelectrones emitidos es, entonces, (4.3-1) en donde la frecuencia de umbral w 0 debe estar dada por W0

= e 0 /h.

(4.3-2)

Todo esto concuerda con los hechos experimentales que se describieron previamente. Además, la ecuación (4.3-1) predice que la pendiente de la curva que da Em en función de w, será la constante de valor h. ¡Cuándo esta pendiente se evalúa basándose en datos experimentales, se encuentra, en efecto, que es una constante y da un valor de h que concuerda exactamente con el valor derivado por Planck de los datos experimentales corrrspondientes a la radiación de cuerpo negro! El efecto

Calor específico de los sólidos

83

fotoeléctrico proporcionó así, en unos cuantos años, una confirmación notable de la teoría cuántica, en un campo muy alejado de su aplicación original.

4.4

CALOR ESPECIFICO DE LOS SOLIDOS

La física clásica considera que un cristal sólido es un conjunto de átomos que se mantienen unidos en un arreglo periódico por medio de ciertas fuerzas de atracción. Se supone que los átomos son libres para vibrar alrededor de sus posiciones de equilibrio bajo el efecto de las fuerzas presentes y, para lograr una primera aproximación, las fuerzas y los desplazamientos átomicos se relacionaron por medio de la ley de Hook. Entonces, el efecto de la energía térmica consistiría en hacer que estos átomos vibraran como osciladores armónicos alrededor de sus posiciones de equilibrio. Un resultado elemental de la teoría cinética clásica consiste en que si las energías de un conjunto de osciladores clásicos se distribuyen de acuerdo con la ley de Boltzmann en equilibrio térmico, la energía promedio de un oscilador es kT para cada grado de libertad vibratoria, en donde T es la temperatura absoluta y k la constante de Boltzmann (igual a 1.380 x 10- 16 erg¡oK). En una sección posterior se verá cómo se derivó este resultado. Entonces, de acuerdo con la física clásica, puesto que hay tres grados de libertad de vibración independiente, por átomo, se debe esperar que la energía interna térmica total de un cristal compuesto de N átomos idénticos sea U= 3NkT.

(4.4-1)

La capacidad calórica a volumen constante, Cv, es por definición, la razón de aumento de la energía interna por unidad de incremento de la temperatura, medidas en condiciones de volumen constante o, en este caso.

c. = (oUfoT). = 3Nk.

(4.4-2)

De acuerdo con la fórmula clásica (4.4-2), la capacidad calórica debe ser independiente de la temperatura. Si en (4.4-2) N es igual al número de Avogadro NA (igual a 6.025 x 10- 23 mol- 1 ), se puede ver que la capacidad calórica molar de todos los elementos químicos sólidos debe tener el mismo valor 3NAk, igual o aproximadamente 6 cal °K-- 1 mol- 1 . Este resultado se conoce como la ley de Dulong y Petit, y concuerda bastante con el experimento para muchos elementos a la temperatura ambiente y por encima de ésta. A temperaturas bajas, el resultado clásico no concuerda con l::t experiencia, ya que los datos experimentales indican que la capacidad calórica se acerca a .;ero, conforme la temperatura tiende a cero en la escala absoluta, según se indica en la figura 4.4. Por supuesto, estas mismas observaciones generales se aplican al calor específico a volumen constante cv, que se define sencillamente como

c.= (oU/oT)vfV.

(4.4-3)

En 1911, Einstein explicó las discrepancias entre la teoría clásica y la experiencia, y en 1912, Debye propuso una explicación más exacta basándose en la teoría cuántica. De acuerdo con la hipótesis original de Planck, un oscilador armónico puede poseer sólo ciertos estados de energía discreta que tienen los valores (4.4-4)

84

Mecánica cuántica. Generalidades

c. 3Nk

Figura 4.4.

ley clásica de Dulong • Petit _____

1_ _______~

Datos experimentales típicos· para el calor específico de una substancia sólida, en función de la temperatura, en comparación con el resultado clásico de Dulong-Petit.

en donde w 0 es la frecuencia clásica del oscilador. Como se verá más tarde, esto da como resultado un promedio de energía de oscilador diferente del resultado clásico, y capacidades calóricas que concuerdan con los datos experimentales a todas las temperaturas. También en este caso, la teoría cuántica ha proporcionado una explicación sencilla de un efecto que no podía analizarse de acuerdo con los métodos clásicos, siendo también este campo muy distinto del de la aplicación original.

4.5

EL ATOMO DE BOHR

Uno de los aspectos más desconcertantes del comportamiento atómico al que se enfrentaron los físicos del siglo diecinueve, consistió en los espectros de emisión y absorción de los elementos. Las líneas espectrales claras y discretas que se observaron, no podían entenderse en absoluto a la luz de la mecánica clásica y la teoría electromagnética. No obstante, en 1913, Niels Bohr propuso un modelo del átomo del hidrógeno basado en la hipótesis cuántica de Planck, que describe con precisión sorprendente las principales características del espectro del hidrógeno atómico. En el modelo de Bohr, que se basó en el concepto del átomo nuclear propuesto por Rutherford en 1910, se supone que un electrón de masa m y carga -e se desplaza en un órbita alrededor de un núcleo mucho más masivo, de carga + Ze, en donde Z es un entero. La introducción del factor Z permite explicar no sólo el hidrógeno (Z = 1), sino también otros iones parecidos a éste, tales como He+ (Z = 2), u++ (Z = 3), Be+++ (Z = 4), etc., que se componen de un solo electrón y un núcleo pesado. De acuerdo con la electrodinámica clásica, las cargas aceleradas siempre irradian energía, y un sistema como el que propuso Bohr, en donde el electrón está sometido siempre a una aceleración central, perdería energía constantemente en forma de radiación y el electrón giraría en espiral acercándose gradualmente hacia el núcleo. Sin embargo, Bohr supuso que el electrón podía existir en órbitas estacionarias alrededor del núcleo sin irradiar energía en absoluto, a condición de que la cantidad de moPimiento angular relacionada con este movimiento estuviera cuantizada en tal forma que sólo se tuvieran los valores permitidos nh, en donde n es un entero positivo. Entoncc~. b~ transiciones entre los estados estacionarios permitidos n y m

El átomo de Bohr

85

se relacionan con la emisión o absorción instantánea de un fotón de frecuencia Wmn tal que

(4.5-1) en donde Em es la energía asociada con el estado de la cantidad de movimiento angular mh y En de energía correspondiente al estado de la cantidad de movimiento angular nh. Por supuesto, desde el punto de vista de la dinámica, la órbita del electrón alrededor del núcleo podía ser circular o elíptica; pero para facilitar las cosas, se supondrá que es circular. Los valores permisibles de la cantidad de movimiento angular L están restringidos a enteros múltiplos de h, de tal manera que

(n = 1,2,3, ···),

(4.5-2)

en donde rn es el radio de la órbita con un momento angular nh y Wn es velocidad angular del electrón dentro de dicha órbita. Para una órbita estacionaria, radio rn debe ser tal que la fuerza electrostática de atracción entre el electrón y núcleo, Ze 2 /r~, es justamente la fuerza centrípeta mvMrn necesaria para mantener electrón dentro de la órbita circular, de donde,

la el el al

(4.5-3)

Las ecuaciones ( 4.5-2) y ( 4.5-3) se pueden resolver ya como ecuaciones simultáneas para r n y W 12 , dando n21i2

r =-" Zme 2

(4.5-4)

y

(4.5-5)

La energía cinética del sistema,

ek>

_ 1 2 _ ¡;k- "lmv"-

está dada por

Z l me4 2 2 _ !mr"w" - - -2- 2 • 2n li

(4.5-6)

La energía potencial eP, es 2

¡;P

= -Ze ft"n = -



Z2 -2-2-.

n li

(4.5-7)

Por tanto, la energía total del sistema es

(n

= 1,2,3, ···).

(4.5-8)

Como se puede ver, la energía del sistema está limitada a ciertos valores discretos o niveles de energía correspondientes a n = 1, 2, 3, •••. Si Z = l, el sistema

86 Mecánica cuántica. Generalidades

l

Energía •

o ~

114'1

-

¡¡-

-

11

Serie de Paschen

•3= 1

Serie de Balmer

Serie de Lyman

me 4 Figura 4.5.

Niveles de energía del átomo de hidrógeno según lo pll'dlc ho por la teoría de Bohr. Se indican las transiciones correspondientes a cierta~ lmcas espectrales prominentes.

correspondiente al átomo de hidrógeno y el diagrama de niveles de energía resultante se ilustra en la figura 4.5. Las transiciones entre los niveles de energía se logran mediante la absorción o la emisión de un fotón cuya frecuencia está dada por (4.5-1), correspondiendo cada transición de este tipo a una línea posible del espectro. La teoría de Bohr explica con claridad y precisión el espectro del hidrógeno y de los iones semejantes a él, y se puede ver que las frecuencias espectrales predichas y las observadas son muy semejantes. En la exposición anterior se supuso que las órbitas de los electrones son circulares. En general, las órbitas pueden ser elípticas y, en efecto, se puede demostrar que existen series regulares de órbitas elípticas permitidas que satisfacen la condición cuántica ( 4.5-2). Sin embargo, estas órbitas elípticas no establecen nuevos niveles energéticos, sino que sólo representan órbitas para las que la cantidad de movimiento angular tiene un valor mh en donde m es un entero menor que n, así pues, el sistema posee una energía En de acuerdo con lo que determine (4.5-8); pero su cantidad de movimiento angular, aunque sigue siendo un entero múltiplo de h, es menor que el valor máximo nh que corresponde a una órbita circular. También se ha considerado que el núcleo está fijo, lo cual es cierto sólo en el límite en que la relación de la masa nuclear a la electrónica se hace infinita. Para una masa nuclear finita, el núcleo y el electrón girarán alrededor de un centro común de masa. Este efecto se explica fácilmente y el resultado es que la cantidad m de las ecuaciones anteriores se debe substituir por una masa reducida J1 dada por (4.5-9) siendo M la masa nuclear. En el caso del átomo del hidrógeno, la masa reducida difiere de la electrónica en aproximadamente 1 parte por 1850.

La hipótesis .te De Broglie

87

Se hicieron numerosos intentos para generalizar el modelo de Bohr con el fin de explicar los espectros del helio y átomos más complejos; durante la década que siguió a la presentación del modelo, todos los esfuerzos fracasaron debido a que no se encontró una forma sencilla para describir las órbitas. En general, los resultados de los cálculos hechos no concordaron con la experiencia, ni se logró que la teoría de Bohr explicara por qué algunas transiciones entre estados electrónicos en átomos complejos, aparentemente, estaban prohibidas. No obstante, el modelo de Bohr proporcionó por vez primera una explicación simple, coherente y exacta de los espectros de átomos monoelectrónicos así como un marco conceptual que permitía entender ciertos aspectos del comportamiento atómico y que resulta útil incluso hasta hoy. 4.6

LA HIPOTESIS DE DE BROGLIE Y LAS PROPIEDADES ONDULATORIAS DE LA MATERIA

En 1924, De Broglie sugirió que a una partícula con cantidad de movimiento p, se le podría asociar una onda de longitud de onda A tal que

h

p

h 2n

= ¡ = 2n T = ñk.

(4.6-1)

La condición cuántica de Bohr se sigue directamente de esta hipótesis, si se supone que las órbitas permitidas de la sección anterior alojan un número entero de longitudes de onda de la partícula, definidas por (4.6-1 ). Puesto que la longitud de trayectoria de la órbita es 21Trn, de acuerdo con este concepto, se debe determinar

o bien, (4.6-2) Davisson y Germer demostraron experimentalmente que los electrones podían, en efecto, difractarse de los cristales, obteniéndose el mismo patrón para un cristal dado que el que producen los rayos X de longitud de onda A = h/p, según propuso De Broglie. La condición para la difracción de electrones de planos cristalinos es, precisamente, la condición de Bragg siendo A igual a h/p,

nA.

= nh/ p = 2d sen 9.

(4.6-3)

Posteriormente se ha demostrado que los átomos neutros, los protones, los iones positivos y otras partículas, presentan el mismo comportamiento ondulatorio, y en cada uno de estos casos se satisface la relación de De Broglie ( 4.6-1 ).

4. 7

MECANICA ONDULATORIA

En 1926, Schrbdinger desarrolló un patrón unificado para la mecamca, basándose en las ideas físicas de la teoría cuántica de Planck, y utilizando los conceptos de De Broglie sobre la naturaleza ondulatoria de la materia. Este patrón, que se denomina mecánica ondulatoria, constituye una versión muy general de las leyes de la mecánica, diseñada especialmente para abarcar el campo de los fenómenos ató-

88 Mecánica cuóntictl. Generalidades micos y nucleares. Este planteamiento ha tenido un éxito rotundo y, hasta donde se puede afirmar en la actualidad, constituye una forma correcta de describir el comportamiento físico de la materia en una escala atómica o en cualquier escala, ya que la mecánica ondulatoria proporciona los mismos resultados qu¡; la mecánica newtoniana clásica para los sistemas relativamente grandes y masivos que se pueden observar en forma macroscópica. Casi al mismo tiempo, Heisenberg diseñó otro sistema de mecánica cuántica denominada mecánica de matrices, basada en las mismas ideas físicas que la mecánica ondulatoria. Aunque su formulación matemática difiere bastante de la mecánica ondulatoria de Schrodinger más tarde se demostró que, en realidad, las dos mecánicas constituyen sistemas equivalentes. La exposición de esta obra se confirmará mayormente a la descripción de la mecánica ondulatoria de Schrodinger, que es más sencilla y se relaciona con mayor facilidad a las situaciones físicamente observables. En la formulación de Schrodinger de la mecánica cuántica, una cantidad compleja '11, denominada función de onda, se relaciona con un sistema dinámico. Esta cantidad es una función de tres coordenadas espaciales para cada partícula del sistema, y el tiempo. Las propiedades dinámicas del sistema están íntimamente relacionadas con las propiedades de la función '11 y el comportamiento dinámico del sistema se puede determinar cuando se conoce la función '11 del sistema. Para un sistema de una sola partícula, que será el tema general de este libro, las propiedades de la función de onda '11 se pueden expresar de acuerdo con los siguientes cinco postulados: 1 l. Se tiene una función de onda compleja relacionada con la partícula, '11 (x, y, z, t), en donde x, y, z, son las coordenadas espaciales y t es el

tiempo. 2. La expresión clásica correspondiente a la energía total e del sistema (que se conoce con el nombre de Hamiltoniano clásico del sistema) dado por p2 2m

+ V(x,y,z) =e,

(4.7-1)

en donde p es la cantidad de movimiento de la partícula, m es su masa y V(x, y, z) es la energía potencial, se pueden convertir en una ecuación ondulatoria por medio de ciertos operadores de asociación con las cantidades dinámicas clásicas, y permitiendo que estos operadores se apliquen a la función de onda como lo indica (4.7-1). Los operadores correspondientes a las cantidades dinámicas pertinentes son: dynamical variable

associated operator

X, y, O Z f(x,y,z)

~

p

~

~

y, O Z f(x,y,z) X,

~V

'

e

~

(4.7-2)

ha

; ot ·

1 C. W. ShNwin, lntrodur·tion to Quantum Mechanics, Holt, Rinehart and Winston, Nueva 'orl.. (1959). p;Í¡:ina 14. pJ¡•ina\ li2-63 Con'>Ílltcs<' también respecto a la ampliación de estos P<"tul.ld<" a ~~~ll'llla~ de m..Í\ de una partícula

Mecánica ondulatoria

89

Puesto que las componentes cartesianas de operador son (3/3x, 3/3y, 3/3z), es evidente que los operadores correspondientes a las componentes de la cantidad de movimiento Px• Py· Pz son (h/iX3/3x), {h/iX3/3y) y (h/iX3/3z), respectivamente. Así también, puesto que p2 = p • p, el operador correspondiente p 2 debe ser - tJ2( V· V) o - fi2 V2 , de donde, V2 representa al operador laplaceano 32 ¡ax2 + 3 2 /3y 2 + 32 /3z 2 , Al reemplazar las cantidades dinámicas p 2 , V(x, y, z) y e en ( 4.7-1) con sus operadores correspondientes y al permitirles que operen sobre la función de onda '11, se obtiene la ecuación ondulatoria h2

2

- 2 - V 'Y m

+ V(x,y,z)'l' = -

ñ a'l' 7 -. 1

at

(4.7-3)

Esta es la ecuación de Schrodinger para la función ondulatoria, que con frecuencia se expresa en la forma ha'Y Jt"'Y = - - ¡

en donde

Jlf

ot '

(4.7-4)

representa el operador hamiltoniano Jt"

=-

h2 2 2m V

+ V(x,y,z).

(4.7-5)

3. Las cantidades 'IF(x, y, z, t) y V'll deben ser finitas, continuas y de un solo valor para todos los valores de x, y, z y t. 4. La cantidad '11*'11, en donde '11* es el conjugado complejo de '11, es siempre una cantidad real. Esta cantidad se interpreta como la densidad de probabilidad en el sentido de que '11*'11 dv es la probabilidad de que las partículas se encuentren dentro del elemento de volumen dv en el instante t. Esta es toda la información respecto a la ubicación real de la partícula, que se puede obtener de la función de onda; en cuanto al sitio exacto en donde se encuentra la partícula en un momento dado y cuál es su trayectoria, esto no se puede determinar en forma precisa de acuerdo con la mecánica cuántica. Por supuesto, para un objeto grande o masivo, '11*'11 es grande sólo dentro de las fronteras clásicas del objeto y se mueve en el tiempo según lo predicen las leyes de Newton; pero, en una escala atómica, será imposible localizar una partícula en forma exacta y seguir su trayectoria con minuciosidad. Puesto que '11*'11 dv es una densidad de probabilidad y, puesto que la probabilidad de que la partícula se encuentre en algún punto en el espacio, es la unidad, es necesario que la función de onda sea normalizada de tal manera que

i

'Y*'I'dv=1,

(4.7-6)

tomándose la integral sobre todo el espacio. S. El promedio o valor esperado (a.) de cualquier variable dinámica a con la que se asocia un operador a 0 p.• se define mediante (01)

=

i

'1'*01op '1' dv,

tomándose la integral sobre todo el espacio.

(4.7-7)

90 Mecánica cuántica. Generalidades Las características esenciales de toda la mecánica ondulatoria están contenidas en estos cinco postulados. Lo que resta de este análisis estará dedicado a examinar las implicaciones de la misma y a aplicarlas a problemas específicos. No se puede demostrarlas, sólo se puede enunciar que los resultados obtenidos, siempre que se han sometido a prueba por medio de experimentos, han coincidido con las observa· ciones dentro de los límites de la incertidumbre experimental que, en muchos casos, ha sido extremadamente pequeña. Por supuesto, se tratará de demostrar que los resultados de la mecánica ondulatoria son paralelos con los dictados de la intuición y coinciden con los resultados de la mecánica clásica cuando puede esperarse que esto suceda. En relación al último punto, se puede demostrar que la mecánica ondulatoria proporciona los mismos resultados que la mecánica clásica en los que se relaciona con los valores promedios o esperados de cantidades dinámicas. Para hacer las cosas más sencillas, sea una situación unidimensional en la que el sistema dinámico está confinado al eje x. El valor esperado de la cantidad de movimiento Px, de acuerdo con (4.7-7), es, entonces,

f

li a 'l'*(x,t) · - -:--a 'l'(x,t) dx,

oo


=

X

1

_ 00

(4.7-8)

por lo que, al tomar una derivada de tiempo y diferenciarla bajo el signo de la integral de la derecha,

d(px) dt

li

-- = -

i

f"" -ro

a'I:'* -a'I:' dx at ox

-

+ -li i

f"" -

'1' *8 - '1' dx oxot . 2

00

(4.7-9)

Ahora, el valor de a\f! jat está dado por la ecuación de onda (4. 7-3) y el valor de a\f!* jat se puede expresar en forma similar escribiendo la ecuación de onda en función de \f!* en lugar de hacerlo en función de \f!. Esto se logra escribiendo la función compleja \f!(x, t) como la suma de partes reales e imaginarias

'l'(x,t)

=

u(x,t)

+ iu(x,t),

(4.7-10)

substituyendo esta forma de \f! en (4.7-3) e igualando las partes reales e imaginarias de ambos lados de la expresión resultante, para obtener dos ecuaciones de la forma

li 2 2 au --Vu+uV=ñ-. 2m ot

(4.7-11)

Si se multiplica la segunda de estas ecuaciones por - i y se suma a la primera, se obtiene una ecuación de onda para \f!* ( =u - iv) de la forma li 2 - - vzll'* 2m

+ Vtl' * =

ñ D'l'* - --. ' it

(4.7-12)

Dependencia del tiempo de la función de onda En la ecuación ( 4. 7-9), si se expresa mediante (4.7-12), se obtiene

d(px) dt

= -

~ foo 2m

= -

~ 2m

= -

-oo

f<X)

-ac

a\lt j"ot

[azq¡* o'l' -'V* o3'!1] dx ox 2 ax ox 3

[~

por medio de ( 4. 7-3) y

-oo

(a'!l

o'V* - '1'* azq¡)] dxox ox OX ox 2

ox ax

OX

o

-oo

a\lt* jat

+ foo [ V'!l* o'V- '1'* ~ (V'I')] dx OX

-oo

ax

Joo 'V* av '1' dx -oo ' ox

~ [o'V* o'V- 'V* az~]oo - Joo 'V* av 'V dx. 2m

91

(4.7-13)

ax

De acuerdo con el postulado ( 4) anterior, la integral de la cantidad \lt*\lt = u 2 + v 2 sobre el rango de oo a - oo, debe existir; esto significa que tanto u y v, como sus derivadas, deben tender a cero conforme x se acerca a oo ó - oo. Por tanto, \lt y a\lt jax tienden a cero dentro de estos límites, y el primer término de la expresión (4.7-13) desaparece. No obstante, de acuerdo con el postulado (5) anterior, el segundo término de ( 4. 7-13) representa el valor esperado de la cantidad - aV/ ax, que es la fuerza clásica ejercida sobre la partícula. En consecuencia, se tiene que

(4.7-14) que es, sencillamente, la ley del movimiento de Newton. Por tanto, es evidente que en lo que respecta a los valores esperados, la mecánica ondulatoria concuerda con las ecuaciones de la mecánica clásica.

4.8

DEPENDENCIA DEL TIEMPO DE LA FUNCION DE ONDA

Se supondrá que la ecuación de Schrodinger (4.7-3) se puede resolver mediante las técnicas matemáticas usuales o sea, separando las variables. Así pues, se supondrán soluciones de la forma

'V(x,y,z,t)

= 1/J(x,y,z)r/J(t),

(4.8-1)

en donde 1/1 depende sólo de las coordenadas espaciales y 41 depende sólo del tiempo. Al derivar (4.8-1) y al substituirla nuevamente en (4.7-3), es evidente que

n

2

--rjJV

2m

2

n

dr/J dt

1/1+ Vr/Jl/1= ---:1/1-. z

(4.8-2)

Si se dividen ambos lados de la ecuación entre \lt = 411/J, se tiene que

¡¡z vzlf¡

- - - + V(x,y,z) 2m 1/J

1i 1 dr/J

= - - - - =e. i d t

(4.8-3)

92 Mecánica cuántica. Generalidades En ( 4.8-3), el lado izquierdo es una función exclusiva de las coordenadas espaciales, en tanto .:¡ue la expresión central está en función del tiempo solamente. La única forma en que esta igualdad se puede aplicar a todos los valores de las variables, es que cada expresión por separado sea igual a una constante denominada constante de separación y representada por e en ( 4.8-3). En realidad, son dos ecuaciones separadas, una para cp(t), y la otra para ¡J;(x, y, z), de donde,

ie d
(4.8-4)

y

.1 2 lj¡

2m (e+ ""j;2

_ V(x,y,z)) 1/1( x,y,z ) -O.

(4.8-5)

La ecuación ( 4.8-4) se puede integrar de tal modo que dé (4.8-6) La constante de integración que normalmente aparecería como un factor multiplicativo ( 4.8-6) se iguala arbitrariamente a la unidad. Al hacer esto, no se pierde la generalidad que se ha venido sosteniendo. De acuerdo con ( 4.8-1), la función de onda dependiente del tiempo, '11, se puede expresar ahora como

I.JI(x,y,z,t)

= ¡f¡(x,y,z)e-ietfn,

(4.8-7)

en donde ¡J;(x, y, z) es una solución de ( 4.8-5). La expresión ( 4.8-5) se denomina ecuación independiente del tiempo, de Schrodinger, y sus soluciones ¡J;(x, y, z) se llaman funciones de onda independientes del tiempo o de estado estacionario. La ecuación ( 4.8-5) se puede expresar también como sigue (4.8-8) en donde ;jf es el operador hamiltoniano expresado por (4.7-5). Normalmente conviene, siempre que sea posible, resolver las ecuaciones independiente del tiempo ( 4.8-6) y utilizar lo más que se pueda sólo las funciones de onda independientes del tiempo. Las dependencias del tiempo, siempre que se necesiten, se pueden expresar utilizando ( 4.8-7). Para lograr esto en forma correcta, se deben observar ciertos resultados que se obtienen cuando la función de onda tiene la forma ( 4.8- 7). En primer lugar, si la función de onda tiene esta forma, entonces, (4.8-9)

y '11*\lf propiamente dicha es independiente del tiempo e igual a ¡J;*¡J; -; la terminología de funciones de onda de estado estacionario, se aplica a funciones de onda de esta índole. Como consecuencia de este resultado, ¡J¡*¡J¡ tiene la misma interpretación de densidad de probabilidad con respecto a las funciones de onda independientes del tiempo, que la que tiene \lf*\lf con respecto a las dependientes del tiempo. Además, de acuerdo con ( 4.8-9), se sigue que

1

•p*•p dv =

1

¡f¡*¡f¡ dv = 1,

(4.8-10)

Dependencia del tiempo de la función de onda 93 y que la condición de normalización para las funciones independientes del tiempo (4.8-7) es, por tanto, la misma que la que corresponde a las funciones dependientes del tiempo. Por último, si las funciones de onda tienen la forma (4.8-7) y si a 0 p. depende sólo de las coordenadas y no explícitamente del tiempo, el valor esperado de ia variable dinámica representado por el operador CXop. se puede expresar como

(4.8-11)

ya que los factores exponenciales de tiempo se anulan al igual que sucede en (4.8-9), si CXop. no tiene una dependencia explícita del tiempo. Si a 0 p. depende explícitamente del tiemp<', entonces las funciones de onda dependientes del tiempo se deben emplear normalmente para evaluar (a). Se debe observar que estos resultados pueden aplicarse sólo cuando la función de onda total tiene la forma (4.8-7). Si la función de onda total - ('ñ/iXo/ot), es una superposición de funciones de la forma ( 4.8-7) -como puede suceder aun cuando se satisfaga la ecuación ondulatoria dependiente del tiempo- estos tres resultados ya no son válidos y, para calcular las propiedades del sistema, se deben utilizar las funciones de onda dependientes del tiempo. Se puede demostrar fácilmente, usando la función de onda (4.8-7) en (4.7-7), con el operador de energía dependiente del tiempo - (h/i)(o/ot), que el valor esperado de la energía de un sistema en un estado representado por una función de onda de esta clase es, sencillamente, el valor de la constante de separación e. Por supuesto, se puede prever este resultado gracias a la notación seleccionada para la constante de separación. También se puede demostrar, a partir de (4.8-8), que el valor esperado del operador hamiltoniano :tf para un sistema en un estado representado por este tipo de función ondulatoria (el cual, puesto que :tf es un operador independiente del tiempo, se puede calcular empleando la función de onda independiente del tiempo de acuerdo con (4.8-11)), es igual a e, el valor esperado de la energía. Las expresiones (4.8-4) y ( 4.8-5) no imponen ninguna restricción en el valor de e, ya que para cualquier valor de e existe una \}1 que satisface estas ecuaciones. Sin embargo, los requisitos de continuidad, el aspecto finito y el valor único, pueden seleccionar, de entre el continuo infinito de soluciones posibles, sólo ciertas soluciones individuales que satisfagan estas condiciones, que corresponden a ciertos valores discretos de la constante de separación (y, por tanto, la energía) e. De esta manera se puede encontrar que sólo un grupo determinado de soluciones 1/ln(x, y, z) que se relaciona con un conjunto asociado de niveles energéticos En es aceptable como funciones de onda para el sistema, debido a que sólo estas funciones satisfacen la ecuación de onda y, a la vez, las condiciones de frontera. Las funciones de onda aceptables se denominan funciones propias del sistema (tomado del alemán eigen, que significa propias o características), y los niveles de energía correspondientes se llaman valores propios de energía. Los niveles discretos de energía del oscilador de Planck y el átomo de Bohr son, en realidad, valores propios de esta naturaleza. De acuerdo con ( 4.8-6), se puede ver claramente que la frecuencia de la función de onda obedece siempre a la relación de Planck

e = liw.

(4.8-12)

En algunos casos, tanto la ecuación de onda como las condiciones de frontera asociadas con ella se pueden satisfacer para cualquier valor de e, o, cuando menos, para cualquier valor de e dentro de un intervalo finito dado. En tales casos existe un rango continuo de energías permisibles o un continuo de niveles energéticos. Más

94

Mecánica cUJÍntica. Generalidades

adelante se verá en qué circunstancias particulares se presentan estas situaciones posibles.

4.9

LA PARTICULA LIBRE Y EL PRINCIPIO DE INCERTIDUMBRE

A continuación se examinará la función de onda de una partícula libre, es decir, que no está sujeta a fuerzas y que, por tanto, se mueve en una región de potencial constante. Este estudio se limitará a una geometría unidimensional en la que el movimiento está restringido al eje x. Por conveniencia y, para no perder generalidad, el potencial se puede considerar con un valor de cero, en cuyo caso la ecuación ( 4.8-5) se convierte en (4.9-1) en donde

J2mejh2.

k=

(4.9-2)

La ecuación (4.9-1) es de un tipo diferencial ya conocido que tiene soluciones de la forma t/J(x)

= Ae±ikx,

(4.9-3)

en donde A es una constante arbitraria. Estas soluciones satisfacen todos los requisitos de las funciones de onda excepto, en un sentido estricto, la integrabilidad en el intervalo - oo < x < oo. Sin embargo, será necesario aceptarlas aunque, como se verá más adelante, se pueden originar ciertas dificultades para satisfacer los requisitos de normalización. Las funciones de onda dependientes del tiempo del sistema, de acuerdo con (4.8-7), serán 'l'(x,t)

= Aei(lkx-wt),

(4.9-4)

en donde, de acuerdo con (4.9-2), flk2

w

= efñ = - . 2m

(4.9-5)

Las soluciones dependientes del tiempo ( 4.9-4) representan ondas progresivas; si se escoge el signo +, la dirección de propagación es a lo largo del eje + x; si se selecciona el signo --, la dirección de propagación es en sentido opuesto. Por tanto, se puede hacer la misma selección de signo para las funciones independientes del tiempo (4.9-3) para representar ondas que se propagan (en el tiempo) en estas direcciones respectivas. El valor esperado de la cantidad de movimiento de la partícula, de acuerdo con ( 4.8-11 ), está dado por (4.9-6)

La partícula libre y el principio de incertidumbre No obstante, de acuerdo con (4.9-3), se puede ver que que (4.9-6) se convierte en (p})

=

±ñk

f

h

oo

1/1*1/1 dx = ±ñk = ± -:;.

-oo

95

a¡J¡¡ax = ± ikl/l, por lo

(4.9-7)

A

Esta expres10n es, sencillamente, un enunciado de la relación de De Broglie (4.6-1); por tanto, la relación de De Broglie para partículas libres está contenida implícitamente en los postulados de la mecánica ondulatoria. Además, por lo que establece (4.9-5), es evidente que

iz2k2

(p2)

B=--=--

2m

2m'

(4.9-8)

lo cual concuerda con el resultado clásico. Al intentar normalizar la función de onda ( 4.9-3) de acuerdo con los requisitos de (4.8-10), se encuentra que el valor de A*A debe escogerse en tal forma que sea infinitesimalmente pequeño a fin de que no diverja la integral (4.8-10). Puesto que, de acuerdo con (4.9-3), la probabilidad 1/1*1/1 dx de encontrar la partícula dentro de un intervalo dx alrededor de un punto x es la misma en todos los puntos e igual a A*A dx y, puesto que la probabilidad clásica a priori de encontrar una partícula libre dentro de una región finita específica de una línea infinita, es infinitesimalmente pequeña, no es sorprendente que esta situación se haya presentado. En efecto, esto coincide con lo que se podía haber esperado desde el punto de vista físico. No se intentará resolver esta dificultad de un modo muy riguroso, sólo se observará que no existen problemas graves al aplicar la condición de normalización (4.8-1 0), siempre que se reconozca la naturaleza singular de las circunstancias que determinan la magnitud de A*A y no se intente evaluar esta cantidad explícitamente en términos numéricos. Las soluciones de la ecuación de Schrodinger independiente del tiempo ( 4.8-5) dan funciones de onda de la forma (4.9-3) o (4.9-4), que representan ondas planas que se propagan a lo largo de la dirección ± x. Puesto que la densidad de probabilidad '11!*'11! asociada con estas funciones es independiente del tiempo, las soluciones (4.9-3) son funciones de onda de estado estacionario. Cada función de onda de estado estacionario se relaciona con un valor único de energía E y, por ende, de acuerdo con (4.9-8) y (4.9-7), representa un estado cuya constante de propagación tiene un valor único k y cuya cantidad de movimiento tiene un valor único Px ( = lik). No obstante, puesto que la amplitud de las ondas es constante, éstas se desplazan de un modo uniforme desde oo a - oo, y, en consecuencia, no tienen una ubicación única en el espacio. Dado que las condiciones de frontera de continuidad, de lo finito, de unicidad, etc., se satisfacen igualmente para cualquier valor de E o k, existe un rango continuo de valores permitidos para estos parámetros. Mediante la superposición de soluciones de este tipo, cada una de las cuales corresponde a un valor diferente de E y k, se pueden construir funciones de onda de la forma

(4.9-9) Debido a la linealidad de la ecuación dependiente del tiempo de Schrodinger, este tipo de funciones de onda superpuestas son soluciones perfectamente adecuadas para la ecuación dependiente del tiempo (4. 7-3); en cambio, no satisfacen la ecua-

96 Mecánica cuántica. Generalidades ción independiente del tiempo ( 4.8-3) debido a que no tienen la forma ( 4.8-7). La amplitud de probabilidad asociada con esta clase de soluciones, no es independiente del tiempo, como sucede con las soluciones de estado estacionario. El método de superposición se puede aplicar en forma más amplia de manera que un número infinito de soluciones de estado estacionario se combine en una función de onda de la forma 'l'(x,t) =

L Anei(kn.x-mntl.

(4.9-10)

n

Los valores de kn se pueden escoger muy cerca unos de otros, separados sólo por intervalos dk, y los valores An pueden asumir la magnitud de cualquier función dada de k en estos puntos, en cuyo caso, la superposición ( 4.9-1 O) se puede convertir, en el límite, en una integral de la forma 'l'(x,t)

= f~

00

A(k)ei
(4.9-11)

Como ejercicio, el lector puede verificar fácilmente el hecho de que ésta constituye todavía una solución a la ecuación dependiente del tiempo de SchrOdinger (4.7-3). La función A(k) de (4.9-11), puede ser cualquier función de k en tanto exista la integral. Supóngase ahora que, en algún instante de tiempo, por ejemplo, t = O, se trata de formar una función de onda cuya densidad de probabilidad '11*'11 se localiza en una región particular del eje x, por ejemplo, entre los puntos x = a/2 y x =- a/2, como se ilustra en la figura 4.6. Esto se puede lograr construyendo una superposición de soluciones de la forma de estado estacionario (4.9-4), perteneciendo a diferentes valores de k, de acuerdo con (4.9-11). Por ejemplo, se puede escoger A( k)

= e sen !(k -

k 0 )a t(k- k 0 )a '

(4.9-12)

en donde e y k 0 son constantes. Se verá directamente que esta selección de A(k) es la correcta si '11*'11 es como se representa en la figura 4.6. Si se substituye (4.9-12) en (4.9-11) y t se hace igual a cero, es evidente que 'll(x,O) =

e f"' -=o

sen t(k - ko)a eikx dk. t(k- k 0 )a

(4.9-13)

'11*'11 (/=O)

Figura 4.6.

La función de densidad de probabilidad de una partícula que, de alguna manera, debe encontrarse forzosamente a lo largo de la región del eje x que se extiende entre a/2 y +a/2.

La partícula libre y el principio de incertidumbre

91

Si se hace que (4.9-14)

q =k- k 0 , esto se puede escribir en la forma .k

'l'(x,O) =Ce'

o.c

foo sen !qa . - - - e'q" dq. -oo !qa

(4.9-15)

Ahora, de acuerdo con el teorema de la integral de Fourier2, una función arbitraria f(x) se puede expresar como una integral de Fourier mediante

f(x)

1 JO() . e'q" dq 2n _ oo

=-

JO()

. ,

f(x')e-•qx dx'.

- oo

(4.9-16)

Si la función representada como 'lt*'lt en la figura 4.6, es decir,

(x) = 1/a

(- a/2 < x < a/2) (4.9-17)

(x > a/2; x < -aí2)

=O

se expresa en forma de integral utilizando (4.9-16), se puede demostrar de un modo directo que

Joo

1 sen fqa . f(x) = - - - e'q" dq = 1/a 2n _ oo tqa =O

(- a/2 < x < a/2)

(4.9-18)

(x > a/2; x < -a/2).

Utilizando este resultado para expresar la integral en (4.9-15) con mayor sencillez, se encuentra que 3 'l'(x,O)

2nC

.k

= -- e' a

0"

( -a/2 < x < a/2) (4.9-19)

=0

(x > a/2; x < -a/2).

La constante de normalización C se debe escoger en tal forma que satisfaga (4.7-6), según lo cual 4n2;2

a

f!a -!a

dx = 4n2C2 = 1 a

2 Véase, por ejemplo, R. V. Churchill, Fourier Series and Boundary Value Problems, McGraw-Hill Book Co. Inc., Nueva York (1941), capítulo V. 3 Aunque todas las funciones de superposición A(k)ei(kx-wt) satisfacen el requisito de continuidad de las funciones de onda, la suma real, según lo expresa (4.9-19), no satisface este requisito para x =±a. Esta violación de los requisitos formales no introduce, por tanto, ningún error en los cálculos ya que, evidentemente, la función del pulso cuadrada (4 9-19) se puede "redondear" muy cerca de x =±a para satisfacer la condición de continuidad sin introducir ninguna alteración significativa en la forma de la función A(k).

98 Mecánica cuántica. Generalidades o bien,

e=

.J~/(2rr).

(4.9-20)

Entonces, 'P(x,O)

1

'k

= J~ e'

""'

(- a/2 < x < a/2)

(4.9-21)

(x > af2;x <- a/2)

=0

En otras palabras, si A(k) se escoge como en ( 4.9-12), con e= ,jíi/(2rr), la función de onda en el instante t = O, dada por ( 4.9-15), se puede expresar en la forma sencilla (4.9-21). La amplitud de probabilidad 'lt*(x, O)'lt(x, O) existente en t = O es, entonces, la de la figura 4.6 y la "partícula" se localiza dentro de una distancia & = a alrededor del origen. Sin embargo, para lograr esta localización, es necesario introducir una superposición de funciones de ondas estacionarias correspondientes a varios valores de k y, por ende, a varios valores de can ti dad de movimiento lík. Las amplitudes relativas de las diversas componentes en la sup~osición, están dadas por la función A(k) y, por tanto. por (4.9-12) siendo e=ya/(2rr). En la fi~ura 4. 7 aparece una gráfica de estas amplitudes de contribución en función de ka. Las principales contribuciones provienen de la región cercana a k = k 0 y la contribución desciende rápidamente para componentes con valores de k mucho mayores o mucho menores que k 0 • Se puede considerar que las contribuciones a la superposición de valores de k mayores que k 0 ++~ y menores que k 0 -+~ son despreciables, siendo ~ un parámetro que expresa la anchura efectiva de la parte de la curva de A(k), en donde A(k) asume valores que no son pequeños en comparación al valor máximo A(k 0 ). Si arbitrariamente se escoge un valor tal de ~ que t:J...ka) = 8rr, o sea, una posición correspondiente al segundo cero de la curva a ambos lados de k= k 0 , -siendo ésta una selección ;azonable de acuerdo con el criterio anterior- se tiene que Ak

= 8rrfa.

(4.9-22)

A(k)

Figura 4. 7.

lli~trihudón de la amplitud de la cantidad de movimiento correspondiente a la ·'lnplltud de (Hl'h.lhilida
La partícula libre y el principio de incertidumbre

99

El producto de la distancia Ax dentro de la cual se puede considerar que se localiza la partícula, y la incertidumbre !lk en la cantidad de movimiento que se introduce mediante la superposición de estados requerida para lograr esta localización, es 8n ó.k · ó.x =-·a= 8n, a

o bien, puesto que k

= p/h, (4.9-23)

ó.p · ó.x = 8nli.

Olvidando los valores numencos que se obtienen de la selección arbitraria de un punto de corte para !::k, y utilizando el símbolo - para indicar "del orden de'', se puede escribir (4.9-24) ó.p . ó.x - li. Para una partícula libre cuya cantidad de movimiento se caracteriza por un valor único singular de k, la "partícula" se extiende a lo largo de todo el espacio. Si la partícula debe estar dentro de una región dada del espacio, entonces, su función de onda, que ahora se debe considerar como una superposición de funciones de estado estacionario con diferentes valores de k, se caracteriza por un "despliegue" de valores de cantidad de movimiento tal que se obedezca a (4.9-24), según se ilustra en la figura 4.6. Fste es un ejemplo específico de un efecto conocido con el nombre de Principio de incertidumbre de Heisenberg, el cual es una consecuencia muy general deducida de la descripción de la naturaleza en términos de la mecánica ondulatoria. El principio de incertidumbre establece que la posición de una partícula y su cantidad de movimiento no se pueden definir simultáneamente con precisión arbitraria; cualquier experimento que se realice para asegurar que la partícula se localizará dentro de una región dada del espacio, introducirá inevitablemente una mcertidumbre en su cantidad de movimiento, que estará dada por (4.9-24). Se debe recalcar el hecho de que este efecto es independiente de la precisión experimental con que se pueden medir las cantidades de que se trata y, en realidad, es una propiedad que tiene la materia en observación. Por lo general, se puede demostrar que las relaciones de incertidumbre tales como ( 4.9-24) existen entre todos los pares de variables dinámicas conjugadas que se podrían usar clásicamente para especificar por completo el estado de movimiento del sistema. Powell y Craseman 4 han escrito un análisis completo y detallado de este tema. Si en (4.9-24) se escribe Ax = v t:.t, en donde v es la velocidad, se obtiene V Ó.p Ó.t "'

Puesto que, para una partícula libre, de expresar como sigue

Ji.

E= p 2 /2m, ÁE = p

ó.e · ó.t - li.

(4.9-25)

fjp/m

=

v fjp, (4.9-25) se pue(4.9-26)

Por tanto, la relación de Heisenberg (4.9-24) también se puede expresar como la incertidumbre de energía del tren de ondas multiplicada por la duración de éste. Conviene observar que el comportamiento del "paquete de ondas" que se estudió con anterioridad, se puede expresar como una función del tiempo por medio L. Powell y B, Craseman, Quantum Mechanics, Addison-Weslcy, Reading. Mas~, (1961) 69-76; páginas 182-184,

4 J,

pág~nas

100 Mecánica cuántica. Generalidades de (4.9-11), con A(k) según la da (4.9-12). Se puede demostrar que el máximo de la amplitud de probabilidad "11'*"11' se mueve a la velocidad constante hk0 fm, correspondiendo a una cantidad de movimiento constante hk0 según lo predice la m'ecánica clásica. Además de este movimiento clásico del paquete como un todo, también se sabe que el paquete se despliega conforme transcurre el tiempo, en tal forma que siempre se satisface la relación de incertidumbre ( 4.9-24). En los casos de paquetes de ondas que representan objetos grandes o masivos localizados dentro de distancias macroscóp;r ente observables, este efecto de despliegue es tan pequeño que es indetectabh: a una escala de tiempo razonable. s

4.1 O UNA PARTICULA EN UN POZO DE POTENCIAL UNIDIMENSIONAL E INFINITAMENTE PROFUNDO

En este ejemplo se examinará el comportamiento de una partícula ubicada en el pozo de potencial unidimensional que se ilustra en la figura 4.8. Para este sistema, se tiene que V(x) =O =00

(O< x a).

(4.10-1)

En la región (O <x
en donde k= J2me/1i 2 •

V(x) ..

'

(4.10-3)

.

V=O-L....--~-x

X=O 1

Figura 4.8.

Prt:'~~.

X=o 1

Un "pozo" de potencial infinitamente profundo.

s L Ikcnherry, Quantum Mechanics for Mathematicians and Physicists, Oxford University Nut rel="nofollow">va York (1962}, r:ígina 64.

Una partícula en un pozo de potencial unidimensional

101

En esta región, la partícula es libre y la solución ( 4.1 0-2) se puede expresar en la forma (4.9-3). Sin embargo, es más conveniente escribirla en la forma equivalente

+ B cos kx

t/J(x) =A sen kx

(0 < x
(4.10-4)

en donde A y B son constantes arbitrarias. Puesto que la partícula está limitada por barreras de potencial infinitamente altas en x = O y x =a, se supondrá que t/J(x) =O

(x a).

(4.10-5)

Esta suposición, que parece ser físicamente razonable, se justificará más tarde en la siguiente sección. Si se requiere que t/l(x) sea continua en las fronteras del pozo de potencial en x =O y x =a, entonces, (4.10-4) se debe reducir a cero en esos puntos. Si se substituyen los valores x = O y x =a en (4.1 0-4) y el resultado se hace igual a cero, es evidente que B =O y que A sen ka= O.

(4.10-6)

Esta condición se puede satisfacer sólo cuando (n

ka= nn

=

1,2,3, ... ),

(4.10-7)

de donde, sólo para una secuencia discreta de valores de k, que se identifican como kn, en donde

k. = nnfo

(n

= 1,2,3, ... ).

(4.10-8)

Puesto que k está relacionada con la energía por medio de (4.10-3), esta condición se define como un conjunto discreto de valores propios de energía permisibles

li2k! n2n21i2 e=--=--• 2m 2ma 2

(n

= 1,2,3, ... ).

(4.10-9)

En la figura 4.9 se muestra un diagrama de los niveles de energía de este sistema. En vista de los requisitos establecidos en ( 4.1 0-8), las funciones de onda del sistema deben tener la forma nnx t/l.(x) = A. sena

=0

(O< x
(xa),

(4.10-10)

en donde las constantes An están determinadas por los requisitos de normalización ( 4.8-1 0), de acuerdo con los cuales,

J oo

-oo

t/l:t/1. dx = A!

f" sen o

2 -nnx

a

dx = 1

(4.10-11)

lo cual da A.= 1/j~.

(4.10-12)

102

Mecánica cuántica. Generalidades

·¡ +-------

25<¡

16<¡

+------- .•

4<¡

+------- •2

o Figura 4.9.

E5

7T2h2

2 -:l=======~·~~'_2_m_u_

Niveles de energía permisibles para una partícula que se encuentre dentro del pozo de potencial ilustrado en la figura 4.8.

La dependencia del tiempo de las funciones de onda se determina fácilmente a partir de ( 4.8-7). Por supuesto, las funciones ( 4.10-1 O) son funciones propias de estado estacionario para las que '1'*'1' es independiente del tiempo. Para este sistema, se sabe que existe un sistema de niveles discretos de energía, dados por ( 4.1 0-9). La ecuación de Schrbdinger ( 4.1 0-2) dentro de la región permitida de movimiento es la misma que para una partícula libre (4.9-1) para la que se permite un rango continuo de valores de energía, y las soluciones ( 4.1 0-1 O) son simplemente combinaciones lineales de las soluciones para la partícula libre de la forma ( 4.9-3) pertenecientes a la misma energía. La diferencia entre los dos casos se basa únicamente en las condiciones de frontera las cuales, en el pozo de potencial, se pueden satisfacer sólo para un conjunto discreto de energías. La condición de continuidad de la pendiente de las funciones de onda (4.10-10) se viola abiertamente en x =O y x =a. Esta situación se origina debido a la singularidad de la función de potencial V(x) en estos puntos y no produce dificultades en la interpretación física de los resultados. Ei comportamiento de la función de onda en estos puntos se puede inferir como un caso límite de los resultados, que se verá en la siguiente sección, en donde se confirman los cálculos que condujeron a ( 4.10-1 0). Las funciones de onda ( 4.10-1 0), se pueden representar como sigue

(4.10-13) en la región (O< x
Partícula en un pozo unidimensional de profundidad finita

103

.¡,•.¡,

.¡, (x)

ljl(x)

n

(\

"-

(\

o

o

o _K

-x n~1

V

V

V

n~a

(a)

Figura 4.10.

V

(b)

Funciones de onda y amplitudes de probabilidad de dos determinados estados de energía permisibles de una partícula que se encuentra dentro de un pozo infinitamente profundo.

es igual a l/; 2 , ya que ¡!; ('S real), se hace infinitamente pequeña. La amplitud de probabilidad cuántica para lo~ estados de energía más bajos no concuerda con la amplitud de probabilidad constante que se podría esperar desde el punto de vista clásico y que en la figura se ilustra por medio de las líneas punteadas. Sin embargo, para estados de energía más altos, además de la rápida oscilación de la amplitud cuántica alrededor del valor clásico como un promedio, la coincidencia es aceptable en el sentido de que el valor medio de la amplitud de probabilidad cuántica tomada sobre cualquier intervalo de longitud apreciable es casi igual a la amplitud clásica.

4.11

UNA PARTICULA EN UN POZO UNIDIMENSIONAL DE PROFUNDIDAD FINITA

El comportamiento de una partícula dentro de un pozo unidimensional de profundidad finita se puede calcular, siguiendo las líneas generales del planteamiento utilizado en la sección 4.1 O. En este caso se supondrá un pozo de potencial de la forma ilustrada en la figura 4.11, en donde la profuncidad del po:w es V0 . Se deben resolver ecuaciones por separado para la función de onda en las regiones (x<-a), (-a<xa), y las funciones de onda en estas regiones se denominará, respectivamente, l/1-(x), l/1 0 (x) y l/l+(x). En primer lugar, se tratará el caso de una partícula que está limitada clásicamente a permanecer dentro del pozo, es decir, una partícula para la que - V0 <e< O.* En las regiones fuera del pozo (x < -a; x >a), la ecuación (4.8-5) se convierte en

(x<-a;x>a)

* N.

de T. La partícula posee en esta región los estados ligados.

(4.11-1)

104 Mecánica cuántica. Generalidades

V(x)

o

-

-x

-a-

-a~

'~'o(x)

(x)

-Vo

Figura 4.11.

Un pozo de potencial de profundidad finita.

en donde (4.11-2) mientras que, en el pozo, en donde V(x) =- V0 , (4.8-5) se convierte en d2r/Jo -d 2 X

2

+ k 0 r/1 0 (x) =

(-a<x
O

(4.11-3)

en donde (4.11-4) Como se ha definido, en la condición (- V0 < €
r/1 0 (x) = A 0 sen k 0 x + B 0 cos k 0 x rf¡_(x)

=

A_ekx + B_e-kx

(x rel="nofollow"> a)

(4.11-5)

(-a<x
(4.11-6)

(x <-a).

(4.11-7)

Las condiciones de frontera de la función de onda requieren que dicha función y su derivada sean continuas en x =±a y que la función de onda tienda a cero

conforme x

"* ± oo. Por tanto, es necesario que r/ló(a) r/1 0 ( - a) = rf¡ _ ( - a)

= rf¡~(a)

r/ló( -a)= rf¡'_( -a) 1/J_(- oo) =O,

(4.11-8) (4.11-9) (4.11-10)

en donde las primas indican las derivadas con respecto a x. En la expresión (4.11-10), es evidente que A+= B_ =O. Los cuatro coeficientes restantes se

Partícula en un pozo unidimensional de profundidad finita

1OS

pueden evaluar mediante la substitución de las soluciones (4.11-5,6,7) en las cuatro condiciones de frontera (4.11-8) y ( 4.11-9), de donde se obtiene un grupo de cuatro ecuaciones simultáneas de la forma

=0 - A 0 sen k 0 a

+ B 0 cos k 0 a (4.11-11)

A 0 k 0 cos k 0 a

+ B 0 k 0 sen k 0 a

-A_ ke -ka = O.

Para resolver completamente el problema, se deben determinar los valores de las cuatro constantes arbitrarias A 0 , B 0 , A_ y B+. Las expresiones (4.11-11) forman un conjunto de cuatro ecuaciones homogéneas con estos coeficientes desconocidos. Un resultado elemental de la teoría de las ecuaciones algebraicas lineales es que un conjunto de ecuaciones de esta naturaleza no pueden tener otra solución que no sea A 0 = B 0 =A_ = B+ = O, a menos que desaparezca el determinante de los coeficientes del sistema. 6 Esto significa que no existen soluciones de significado físico, a menos que

e

sen k 0 a -sen k 0 a k 0 cos k 0 a k» cos k 0 a

- 2ka

cos k 0 a cos k 0 a -k 0 sen k 0 a k 0 sen k 0 a

-1

o k

o

o -1

o

=0.

(4.11-12)

k

Para obtener esta expresión, la can ti dad e- ka se sacó por factorización de las columnas tercera y cuarta del determinante de los coeficientes de (4.11-11). Puesto que e-2ka no desaparece para ningún valor real de ka, el determinante debe hacerlo ·a fin de satisfacer ( 4.11-12). El determinante se puede expresar como menores para dar la ecuación

que se puede escribir también como (k sen k 0 a

+ k 0 cos k 0 a)(k 0 sen k 0 a -k cos k 0 a) =O.

o, dividiendo entre cos 2 k 0 a,

(k tan k 0 a

+ k 0 )(k0

tan k 0 a- k)= O.

(4.11-13)

Esta ecuación se satisface si desaparece cualquiera de los factores. Si se hace que

(4.11-14)

6 Véase, por ejemplo, N. B. Conkwright, lntroduction to thc Theory of Equations, Ginn and Co., Boston (1941), páginas 144-145.

106 Mecánica cuántica. Generalidades entonces, de acuerdo con (4.11-4) y (4.11-2), (4.11-15) Al substituir esto en ( 4.11-13) e igualando cualquiera de los factores a cero, se tiene que (4.11-13) se satisface si

( 4.11-16)

o bien,

1 1

1 1 1 1 1 1

t-- Curvas punteadas 1

1

y =-k0 ctn k0 o

1 1

1 1

Figura 4.12.

Diagrama que ilustra la solución de las ecuaciones trascendentales de los valores propios de energía asociados con el pozo de potencial mostrado en la figura 4.11.

Una de estas dos ecuaciones quedará satisfecha sólo para un conj,mto dado de valores de k 0 , que se puede representar mediante k 01 , k 02 , k 03 , • • • kon, •••. Existe un conjunto de valores propios de energía Erz que se relacionan con estos valores de k 0 , de acuerdo con (4.11-4), por medio de (4.11-17) Los valores propios kon se pueden obtener gráficamente encontrando las intersecciones de las curvas y = - k 0 ctn k 0 a y y = k 0 tan k 0 a con el círculo y = yp. 2 - k~, como se ilustra en la figura 4.12. Para cada punto de intersección se satisface cualquiera de las dos ecuaciones (4.11-16). Por tanto, existe un grupo finito específico de valores kon y un número finito de niveles discretos de energía asociados a estos valores, a través de (4.11-17). El radio del círculo y = yp. 2 - k~ de la figura 4.11 es, sencillamente, p. que está directamente relacionado con la profun-

Partícula en un pozo unidimensional de profundidad finita

107

di dad del pozo de potencial por medio de (4.11-14). Para un pozo poco profundo, ~O, y únicamente habrá un solo nivel de energía en el rango - V0 <e< O. Para pozos más profundos, aumenta el número de estados energéticos y para pozos muy profundos, este número es muy grande. Como se ilustra en la figura 4.12, en un pozo muy profundo, los niveles que están en la parte más baja se caracterizan por valores de kon que están espaciados equidistantemente, correspondiendo muy de cerca a los valores de kn del pozo infinito de la sección 4.10. y dando origen a niveles de energía que, con respecto a la base del pozo...,son semejantes a los del pozo infinito. En la figura 4.13 se proporcionan los diagramas de niveles de energía para varios pozos fmitos. J1

--J

-----

-------

----------------------

Estados de energía para un pozo infinito----Estados de energía para un pozo finito

-----

----

--Figura 4.13.

Representación esquemática de los niveles de energía correspondientes a pozos de potencial de distintas profundidades.

Una vez se han determinado los valmes kon para los que ( 4.11-11) tiene soluciones físicamente significativas, es necesario encontrar los coeficientes A 0 , B 0 , A_ y B+. Puesto que para los valores de kon que satisfacen (4.11-16) desaparece el determinante del sistema homogéneo (4.11-11 ), las ecuaciones (4.11-11) ya no son independientes linealmente y, por tanto, lo único que se puede obtener directamente de (4.11-11) son las relaciones de los coeficientes. Sin embargo, las magnitudes reales de los coeficientes se pueden encontrar imponiendo la condición de que

Una vez que se conocen los coeficientes, las funciones de onda se obtienen de (4.11-5,6,7). El cálculo exacto de los coeficientes es un procedimiento laborioso y no se presentará en detalle. No obstante, se analizarán algunas de las propiedades de las funciones de onda que se obtienen de este modo. Las funciones de onda para los estados energéticos ligados de este problema se ilustran en la figura 4.14. Antes que nada, se observará que la función de onda como un todo es una función par o bien, una función impar de x. En el ejemplo de que se trata, el estado energético más bajo es par, el siguiente es impar, el que le sigue es par, y así sucesivamente de un modo alternado. Esto se debe al hecho de que el potencial V(x) es en sí mismo una función para de x; se puede demostrar de

108

Mecánica cuántica. Generalidades

un modo general que, cuando esto sucede, las funciones propias deben ser funciones pares o impares de x. 7

Figura 4.14.

Diagramas esquemáticos de las funciones de bnda de los estados energéticos más bajos del pozo de potencial finito de la figura 4.11.

De acuerdo con la figura 4.14 y las ecuaciones (4.11-5) y (4.11-7), se puede nr que a pesar de que la energía total de la partícula es negativa y, por tanto, de acuerdo con la representación clásica dicha partícula nunca podría sobrepasar la barrera de potencial para aparecer fuera del pozo, de hecho, la función de onda de la partícula se extiende más allá de los límites del pozo. Por tanto, de acuerdo con la mecánica cuántica, existe una probabilidad definida de que la partícula se encontrará en la región clásicamente prohibida, más allá de las fronteras reales del pozo. La función de onda de la partícula se atenúa exponencialmente en esta región y se acerca a cero en la parte que está lejos del pozo. Este fenómeno, que se conoce como penetración de barrera, es un aspecto común del comportamiento cuántico de la materia. Una partícula que se acerca a una barrera de potencial, de altura y espesor finitos, como se ilustra en la figura 4.15, tiene una probabilidad determinada de penetrar la barrera y aparecer en el otro lado, aun cuando esto pueda estar prohibido de acuerdo con la teoría clásica. La función de onda se atenúa dentro de la barrera, y si ésta es muy alta o gruesa, la atenuación se hace muy marcada y la probabilidad de penetración se reduce mucho. En mecánica cuántica este efecto se denomina túnel y se ha observado experimentalmente en dispositivos semiconductores y en capas aisladoras delgadas. Los efectos de reflexión semiconductores y en capas aisladoras delgadas. Los efectos de reflexión se pueden predecir también de acuerdo con la mecánica cuántica, para las partículas incidentes sobre una barrera, 7 Véase, por ejemplo, E. Merzbacher, Quantum Mechanics, John Wiley and Sons, Nueva York (1961), página 53.

Partícula en un pozo unidimensional de profundidad finita

109

•t

Vlxl

·- n

-+X

(O)

(b)

Figura 4.15.

Representaciones hechas de acuerdo con la mecánica clásica (a) y cuántica (b), de una partícula que interactúa con una barrera de potencial cuya altura es mayor que la energía inicial de la partícula. La representación cuántica (b) ilustra el efecto túnel.

por ejemplo, como las que se muestran en la figura 4.15, aun cuando poseen más de la energía necesaria para sobrepasar la barrera clásicamente. El efecto túnel proporciona las explicaciones generalmente aceptadas sobre la ruptura eléctrica que se produce en aisladores, la ruptura inversa en rectificadores semiconductores y la desintegración radiactiva de Jos isótopos a-emisores. Hasta ahora, este estudio se ha basado exclusivamente en la suposición de que la energía total e es negativa, dentro del rango - V0 <e< O. En el caso en que e sea positiva, es fácil apreciar en la expresión (4.11-1) que las soluciones 1/1± fuera del pozo tienen una naturaleza oscilatoria, como sucede con la solución 1/1 0 en su interior. En este caso, se encuentra que la ecuación de Schrodinger y todas las condiciones de frontera se pueden satisfacer para cualquier valor positivo de e. Por tanto, existe un rango continuo de estados energéticos permisibles y funciones propias correspondientes que se extiende en forma ascendente desde e= O en la figura 4.13. Esos estados se denominan "estados del continuo". Para ver cómo sucede esto, supóngase que las funciones propias de este rango de energía son funciones pares o impares de x; como se vio antes, esto es válido si V(x) es una función par. De dor.de, para funciones propias pares, es necesario que

t/1 0 (x) = A 0 cos k 0 x

(-a<xa)

(4.11-19)

(x < -a)

en donde k se define ahora como

k= J2me/ñ 2

(e> 0).

(4.11-20)

Las condiciones de frontera (4.11-8) y (4.11-9) deben aplicarse todavía, de tal manera que los valores y las pendientes de 1/1 0 (x) y 1/J+(x) sean iguales en x =a. De

11 O Mecánica cuántica. Generalidades acuerdo con ( 4.11-19), esto requiere que

A 0 cos k 0 a =A+ cos ka+ B+ sen ka (4.11-21)

y

-k 0 A 0 sen k 0 a = -kA+ sen ka+ kB+ cos ka. Si se dividen ambas ecuaciones entre A 0 y se resuelve el grupo resultante de ecuaciones simultáneas para A+/A 0 y B+/A 0 , se tiene que

A+/A 0 = cos k 0 a cos

ka+~ sen k 0 a sin ka (4.11-22)

B+/A 0 = cos k 0 a sen ka-

kko senk 0 a cos ka.

Por tanto, siempre se pueden encontrar valores perfectamente adecuados para A+ y B+ en términos de A 0 , cuyo valor, a su vez, queda determinado por los requisitos de normalización. Esto significa que cualquiera que sea el valor inicial que se escoja para e o k, se puede encontrar una solución para l/1 0 , W+ y ¡J¡_ que satisfaga todas las condiciones de frontera, como se aseguró antes. Se puede realizar un cálculo similar principiando con las funciones propias impares y se obtendrá el mismo resultado. En la figura 4.16 se ilustra el carácter general de las funciones de onda para los estados del continuo.

(O)

Figura 4.16.

(b)

(a) Representación e~quemática de la función de onda de una partícula cuya energía tan grande que, en la representación clásica, sobrepasa los límites del pozo de potencial ilustrado. (b) División de los niveles de energía permisibles para el pozo de potencial finito, en un grupo de niveles discretos correspondientes a una partícula clásicamente ligada y a un continuo de niveles correspondientes a una partícula clásicamente no ligada. La función de onda representada en (a) pertenece al último grupo de niveles.

El oscilador armónico unidimensioanl

111

Este l.stado de cosas ejemplifica un principio mucho más general. Si la energía total del sistema es tal que la partícula esté limitada clásicamente por medio del potencial V(x) para moverse en una región finita dada del espacio, se tendrá un grupo discreto de funciones propias y niveles de energía que satisfagan todos los requisitos, de las funciones de onda. Por otro lado, para partículas con energías lo suficientemente grandes para que una partícula clásica pueda escapar de cualquier mínimo de potencial del sistema, al infinito en, cuando menos, una dirección, existe también un continuo de estados energéticos y funciones propias correspondientes. 8 Los resultados de la sección 4.1 O para el pozo de potencial infinitamente profundo se pueden obtener a partir de los resultados de esta sección, si se deja que V 0 tienda a infinito. En particular, se puede ver a partir de (4.11-5) y (4.11-7) con A+= B_ =O, que si k se hace indefmidamente grande, como debe suceder para cualquier estado con un energía finita superior a la base del pozo, conforme V 0 ~ c..o, ia función de onda fuera de los límites del pozo tiende a cero. Conforme el pozo se hace cada vez más profundo, la curvatura de la función de onda se hace sumamente grande cerca de x = a y x = - a, en donde las soluciones 1/J +(x) y 1/J _ (x) se unen a la solución 1/J 0 (x), se hace aunque para una profundidad finita de pozo, la pendiente es siempre continua. Sólo en el límite, conforme la profundidad del pozo se acerca a infinito, es cuando se presenta la discontinuidad en la derivada de la función de onda en estos punto, como se mencionó en la sección 4.10.

4.12

EL OSCILADOR ARMONICO UNIDIMENSIONAL

El oscilador armónico es una partícula que está ligada a una postcwn de equilibrio por medio de una fuerza proporcional al desplazamiento desde dicha posición; esta fuerza .:;e puede expresar como

F

=

-kx

=

-dV(x)fdx.

(4.12-1)

Entonces, el potencial V(x) debe ser una parábola de la forma (4.12-2) De acuerdo con ( 4.12-1 ), la ecuación clásica de movimiento para una partícula de masa m sometida a una fuerza de este tipo es (4.12-3) cuya solución es una función oscilatoria que se puede escribir como

x(t) =A sen (w 0 t- 15),

(4.12-4)

en donde (4.12-5) 8 Una simple prueba de estas afirmaciones se puede encontrar en la obra de L. Pauling y E. B. Wilson, lntroduction to Quantum Mechanics, McGraw-Hill Book, Co., Inc., Nueva York (1935).

112

Mecánica cuántica. Generalidades

es la frecuencia clásica del oscilador y en donde A y o son constantes. Siguiendo este resultado clásico, se puede usar ( 4.12-5) para expresar la constante de fuerza k en función de w 0 y m, y volver a escribir el potencial V(x) como (4.12-6) A continuación se procederá a resolver la ecuación de Schrodinger ( 4.8-5) utilizando esta función de potencial; en este caso, (4.8-5) se convierte en

d21/1 2m 2 2 dx2 + hl [e- tmw 0 x ]1/J(x) =O.

(4.12-7)

Para resolver esta ecuación, primeramente es necesario que (4.12-8)

P=

2ef(ñw 0 )

(4.12-9)

e= x.j~.

(4.12-10)

Entonces, de acuerdo con ( 4.12-8) y ( 4.12-9), es obvio que

d21/J dx2

+ (cx.p- cx.2x2)1/J(x) =O,

(4.12-11)

y, por lo que indica (4.12-10) observando que d2 1/f/dx 2 =cx.d 2 1/1/d~ 2 ,

d21/J 2 de+ 1/Jce> Para valores grandes de se escribe como

1~1,

tales que

=o.

~2 ~ (3, (3

(4.12-12)

se puede despreciar y (4.12-12)

(4.12-13) Esta ecuación se satisface aproximadamente, para un valor grande de medio de

~.

por

(4.12-14) puesto que d 2 1/1/de = (~ 2 - l)exp(- ~ 2 /2), lo cual satisface aproximadamente (4.12-13) si ~ 2 ~ l. Esto sugiere que las soluciones 1/1(~) para (4.12-12) podrían expresarse de manera más simple escribiendo (4.12-15) Y transformando (4.12-12) en una ecuación para la función H(~). Esto se logra substituyendo la forma ( 4.12-1 S) en la ( 4.12-12) y como resultado, ( 4.12-12) se convierte en

d2 H dH --2e-+=O. de de

(4.12-16)

El oscilador armónico unidimensional

113

Esta ecuación diferencial se puede resolver mediante una técnica de series de potencias, suponiendo inicialmente que 00

H(') =

L ak'k'

(4.12-17)

k~o

por lo que

(4.12-18) •

00

(p-

1)H(') =

L (p- 1)ak'k· k=O

Si estas tres ecuaciones se suman se observa que el resultado es cero de acuerdo con (4.12-16), y se encuentra que oc

O=

I. [(k+ 1)(k + 2)ak+l +

[(p- 1)- 2k]ak],k.

(4.12-19)

k=O

Esta ecuación debe ser aplicable para todos los valores de ~. y, por tanto, el coeficiente de cada potencia ~ debe desaparecer por separado. (Esto se podrá ver con mayor claridad evaluando los coeficientes para la expansión de la función .f(~) = O en la serie de potencia de McLaurin; todas resultan ser cero.) Este requisito establece inmediatamente una relación de recursión entre los coeficientes ak+ 2 y ak, en donde

p - l - 2k ak+2 = -(k+ l)(k + 2) ak.

(4.12-20)

En la solución de cualquier ecuación diferencial de segundo orden, debe haber dos constantes arbitrarias. Por tanto, sean a0 y a 1 las constantes arbitrarias fundamentales que deben determinarse de acuerdo con las condiciones de frontera, en la expresión de la serie (4.12-17) para H(~), y expresar todos los demás coeficientes en función de estos dos mediante la aplicación repetida de la relación de recursión t.4.12-20). En esta forma, es fácil ver que

P-l


al= - - - a o

2!

a4

p-

5

= - -¡-:-J a2 =

a6 = -

3!


5)

(p- 1)(p- 5)(p - 9) 6! ao

etc.,

ao

as=

a1

=





3)(p - 1)(P - 11) 7! al etc.

(4.12-21)

114 Mecánica cuántica. Generalidades

De acuerdo con (4.12-17), se de be tener

H(~) = ao[1- ((J- 1) e+ ((J- 1)((J- 5) ~4- ((J- 1)((J- 5)((J- 9) ~6 2!

4!

+a¡[~_ {J- 3 3!

+ ... ]

6!

e+ ({J- 3)({J- 7) ~S_ ({J- 3)({J- 7)({J- 11) e+ •••] 5!

7!

.

(4.12-22) Si en la relación de recursión (4.12-20) {3- 1 - 2k debe ser cero para algún valor del índice k, entonces, ak+l = O. Sin embargo, puesto que ak+4 es un múltiplo de ak+l y ak+ 6 es un múltiplo de ak+ 4 , etc., todos los coeficientes subsecuentes que se relacionan con ak por medio de la fórmula de recursión deben desaparecer, y cualquiera de las dos series entre paréntesis rectangulares en (4.12-22) terminaría por convertirse en un polinomio de grado k. Este fenómeno se puede producir sólo para ciertos valores enteros de {3, en efecto, de acuerdo con (4.12-20), sólo ocurre cuando {3 _ 1 es igual al doble de un entero, es decir, cuando (J- 1- 2n =O

o bien,

p=

2n

+1

(n = 0,1,2,3, ... ).

(4.12-23)

Al examinar (4.12-22), se ve fácilmente que esta terminación de una u otra serie para producir un polinomio se realiza efectivamente cuando {3 = 1, 3, 5, 7, . . . como lo predice (4.12-23). De esto resulta que las únicas soluciones de (4.12-16), que llevan a funciones de onda aceptables a través de (4.12-15), SO;'l estas soluciones polinómicas. Para entender el porqué de esto, primero se considerará la expansión en serie para la función et 2 , que se puede escribir (4.12-24) Para valores grandes de t las contribuciones de Jos términos iniciales de esta serie son despreciables en comparación con aquellos para los que k es grande. Por supuesto, esto es cierto también en la serie de (4.12-22) para H(~). En la serie ( 4.12-24), la razón del coeficiente bk+l al coeficiente bk es

y para valores grandes de k,

b~:2 ~ 2/k.

(4.12-25)

El oscilador armónico unidimensional

115

La razón de los coeficientes ak+ 2 y a k para las soluciones en serie de ( 4.12-16) está dada por la relación de recursión ( 4.12-20) y, para valores grandes de k, se puede ver claramente que también es más o menos igual a 2/k. Entonces las soluciones en serie de H(~). cuando no terminan en polinomios, se comportan como e~ 2 para valores grandes de ~- Sin embargo, de acuerdo con (4.12-15), las funciones de onda reales están dadas por (4.12-26) para valores grandes de ~- Puesto que estas funciones no siguen siendo finitas en ±oo, no son aceptables como funciones de onda para el sistema físico. Las únicas soluciones que son aceptables son aquellas que terminan como polinomios, o sea, las soluciones para las que se obedece (4.12-23). Si una de las dos series encerradas entre paréntesis angulares de (4.12-22) termina como polinomio, la solución para H(~) toma la forma

H(e) = a0 (polinomio)

+ a 1 (serie

infinita)

o H(~) = a 0 (serie infinita)

+ a 1 (polinomio).

En cualquier caso, para que la solución H(~) sea una función de onda físicamente aceptable, la constante arbitraria que multiplica la solución en serie se debe escoger en tal forma que sea cero, para que la expresión total de H(~) sea sencillamente un polinomio. Si se expresa (3 en (4.12-13) en función de e por medio de (4.12-9), es evidente que las únicas soluciones que dan las expresiones polinómicas para H(n son las que corresponden a un grupo discreto de valores propios de energía

(n = 0,1,2,3, ... ).

(4.12-27)

Una característica notable de este sistema es que su estado más bajo de energía, para el que n = O, está representado no por e0 = O, sino por e0 = -!-hwo. En otras palabras, el estado más bajo de energía del oscilador armónico no se caracteriza por la ausencia de movimiento vibratorio, sino por una energía vibratoria mínima de "punto cero" -thw 0 . En su teoría original de la radiación de cuerpo negro, Planck supuso que los niveles energéticos de un oscilador armónico estaban dados por En= nhw 0 más que por (4.12-27). No obstante, en ese caso en particular, la energía de punto cero no establece ninguna diferencia en el resultado final. Se observará que los pozos de potencial de las secciones anteriores presentaban también este efecto de energía de punto cero. El diagrama de niveles de energía del oscilador armónico se ilustra en la figura 4.17. El espaciamiento equidistante de los niveles es una propiedad singular del pozo de potencial parabólico. Las soluciones polinómicas que representan las funciones propias del sistema, se pueden obtener de (4.12-22), considerando que (3 toma los valores 1, 3, 5, ••• 2n + 1, ••• de acuerdo con (4.12-23). Para cada uno de estos valores, cualquiera de las dos series entre paréntesis rectangulares terminará en un polinomio y todos los coeficientes más allá de cierto punto se convierten en cero. Por Jo común se escoge la constante arbitraria a0 o bien, a 1 , cualquiera que sea el caso, que multiplica el polinomio resultante en tal fom1a que el coeficiente de la potencia más alta de ~ en el polinomio es 2n( =

116

Mecánica cuañtica. Generalidades

•t •8

fr

13

ñ

11

ñ

"'o

7

2 "'o

6

2 "'o

5

~ hw0

4

~ fr..,o

3

~ ,.,o

2

~ ñ..,o

1

Figura 4.17.

15

2

t fr..,o

o

Niveles de energía del oscilador armónico cuántico unidimensional.

2<13-l )/ 2 ). Cuando se hace esto, se obtiene un grupo de soluciones polinómicas fin(~) de la forma

H¡<e> = 2e H2<e> = 4e 2

H3<e> = se 3Hie> =

16e 4

-

(4.12-28)

12

4se

Hs(ü = 32es- 160e 3

+ 12oe

etc., Los matemáticos conocen bien estas expresiones que se denominan polinomios de Hermite; la ecuación (4.12-16) recibe el nombre de Hermite. Los polinomios de Hermite se pueden definir como

(4.12-29) Se puede demostrar que la defmición (4.12-29) conduce a los polinomios que satisfacen la ecuación de Hermite (4.12-16). La demostración de esto se propone como ejercicio para el lector. Las funciones de onda reales l/ln(x) se obtienen de las soluciones polinómicas de la ecuación de Hermite por medio de ( 4.12-15) y (4.12-1 0), siendo el resultado (4.12-30)

El oscilador armónico unidimensional

117

en donde a está dada por (4.12-8) y en donde la constante de normalización Nn se escoge de tal manera que

Se puede demostrar 9 que esta condición requiere que

(4.12-31)

Las funciones de onda dependientes del tiempo 'l{ln(x, t) se obtienen a partir de las expresiones de (4.12-30) multiplicándolas por el factor e-ientfñ, de acuerdo con (4.8-7). Puesto que más adelante se compararán las propiedades del oscilador cuántico con las de su equivalente clásico, conviene analizar brevemente algunas características del oscilador clásico y, sobre todo, se debe calcular la distribución de probabilidad asociada con éste. Dado que el desplazamiento x(t) de la partícula clásica es como lo establece (4.12-4), se sigue que la energía cinética y la potencial del oscilador clásico están dadas, respectivamente, por

de donde, la energía total debe ser

(4.12-32) Esta ecuac10n se puede resolver para A en función de e, dando A= ..J2e/mw~, y, si se supone que la energía tiene el valor (n +-t)hw 0 (como debe ser en el caso del oscilador cuántico con el que se desea establecer una comparación directa), se obtiene, para la amplitud del oscilador clásico con esta energía

A = J(T,J+i)h mw 0

=

J2n + 1 , ex

(4.12-33)

en donde a está definida por ( 4.12-8). La amplitud de probabilidad es la probabilidad de encontrar la partícula dentro de una región dada dx alrededor del punto x. Para el oscilador clásico, esto es sencillamente, la razón del tiempo dt que la partícula pasa en esta región durante el curso de una vibración, al periodo de oscilación T( = 27r/w0 ). Puesto que dx = v(x) dt, el tiempo que permanece la partícula en este intervalo durante un periodo es

2 d t_-2dx v(x)'

9

(4.12-34)

D. Bohm, Quantum Mechanics, Prentice-Hall, Englewood Clit'fs, N. J. (1951), página 305.

118

Mecánica cuántica. Generalidades

ya que pasa dos veces por la región durante un periodo completo de movimiento. Dado que, de acuerdo con (4.12-4), v(t)=dx/dt=Aw 0 cos(w 0 t- 8), y, puesto que w 0 t- 8 =sen - l (x/A)= cos- 1 (1- (x/A)2)lf2, v se puede expresar en función de x por medio de -~2

v(x)

= Aw 0 J 1- A 2 •

(4.12-35)

La fracción de tiempo que pasa en dx es P(x) dx, en donde P(x) es la ampli· tud de probabilidad clásica correspondiente a la cantidad cuántica 1/J*l/J. En vista de que esta cantidad es igual a 2dt/T, debido a lo que establece (4.12-34) y la relación T = 21T/w 0 , se tiene que (4.12-36) Si se usa (4.12-33), la amplitud de probabilidad de un oscilador clásico que tiene una energía (n + )líw 0 se convierte en

-t

(4.12-37)

Esta cantidad se comparará con las amplitudes de probabilidad cuánticas 1/J~l/Jn obtenidas a partir de ( 4.12-30). En la figura 4.18 se ilustra el comportamiento general de las funciones de onda correspondientes al oscilador armónico. Se observará que también en este caso la función de onda penetra en la región más allá de los límites de amplitud del movimiento clásico. Además, como se puede esperar, debido al hecho de que V(x) es una función par de x, las funciones de onda son, dternadamente, funciones pares e impares de x para valores ascendentes de n. Para el estado de energía más baja, la amplitud de probabilidad clásica calculada a partir de (4.12-37), y representada por la curva punteada en la figura, no se parece en absoluto a la amplitud de probabilidad desde el punto de vista de la mecánica cuántica. La amplitud de probabilidad clásica predice que la partícula tiene una mayor tendencia a encontrarse cerca de los extremos de la región de movimiento permisible, en tanto que el resultado cuántico predice que es más posible encontrarla en el centro. Sin embargo, para un estado de mayor amplitud y de una energía correspondientemente más alta, se encuentra una coincidencia aceptable entre las distribuciones de probabilidad clásica y cuán tic a, aparte del hecho de que, como es normal, la amplitud cuántica de probabilidad oscila con gran rapidez alrededor de un valor medio semejante al resultado clásico. Conforme la amplitud y la energía relacionadas con el movimiento se hacen detectables en una escala macroscópica, los resultados cuántico y clásico no son apre.ciablemente diferentes. Normalmente existen puntos a lo largo de la trayectoria clá~ca de la partícula, en donde la probabilidad de encontrarla, según lo predice la amJ}litud de probabilidad cuántica, se hace sumamente pequeña.

Ortogonalidad de las funciones propias

1 1

'1 1

1

''1

ti

''

1

j

nn -- -- - - -

1 1

n

\

1

:

¡1 1

1 1

11

'- /

1

11

,.

119

'

' '

1 / /

~

lJ

o

:\

e

6

( b) Figura 4.18.

4.13

(a) Funciones de onda de los estados de energía más bajos del oscilador armónico cuántico unidimensional. (b) Amplitudes de probabilidad cuánticas (curvas continuas) y distribuciones de probabilidad clásicas (curvas punteadas) correspondientes al o~cilador armónico unidimensional para dos valores de energía, if:wo y lf.l':wo. [Tomado de L. Pauling y E. B. Wilson, lntroduction to Quantum Mechanics, McGraw-Hill, Nueva York (1935).]

ORTOGONALIDAD DE LAS FUNCIONES PROPIAS Y LA SUPERPOSICION DE ESTADOS

Se puede demostrar que las funciones propias de la ecuación unidimensional de Schrodinger que satisfacen los requisitos físicos de las funciones de onda, presentan siempre la propiedad de ortogonalidad, es decir, que obedecen siempre la ecuación

J~oo 1/1!1/Jn dx =O

(m# n)

=l

(m= n).

(4.13-1)

120

Mecánica cuántica. Generalidades

Estas relaciones son una propiedad característica de la ecuación de Schrodinger y las condiciones de frontera, y se ha encontrado que se aplican sea cual fuere la función de potencial V(x) y sin que tampoco importe la forma matemática que tengan las funciones de onda. Que esto es nece~ariamente cierto, se puede comprobar escribiendo la ecuación unidimensional de Schrodinger para 1/1 n,

(4.13-2) y la ecuación de onda 1/1~, que, de acuerdo con

(4.7-12)

y

d 2 t/l* 2m dx 2m - ¡r [em - V(x)]t/l!(x) =O.

(4.8-6), debe ser (4.13-3)

Si la primera ecuación se multiplica por 1/1 ~, y la segunda por 1/1 n, se restan ambas ecuaciones y se integra de oo a - oo, se obtiene

(4.13-4) El integrando del término del lado izquierdo de esta ecuación se puede expresar como la derivada de 1/l~(dl/ln/dx) -- 1/ln(dl/1~/dx) con respecto a x, de donde, ( 4.13-4) se convierte en (4.13-5)

Para funciones de onda con un buen comportamiento físico, 1/1 y dl/1/dx tienden a cero conforme x ~ ± oo; por tanto, la cantidad de la izquierda desaparece en los dos puntos extremos y

(4.13-6) Si se supone que las funciones de onda 1/1~ y 1/ln pertenecen a dos niveles de energía diferentes, de tal manera que En =1= Em, entonces, se puede satisfacer (4.13-6) si y sólo si (m '# n).

(4.13-7)

Para m= n, se pierde el factor En -En en (4.13-6); en este caso, de acuerdo con la forma en que se definen las funciones de onda ( 4.8-1 0), se debe tener

(4.13-8) Así pues, las funciones dr onda 1/lm, 1/ln exhiben la propiedad de ortogonaltdad. La prop1cdad de ortogonalidad no está restringida a las soluciones de la ecuación de Schrodint'cr. sino que tamhién se relaciona con las soluciones características

Ortogonalidad de las funciones propias

121

de una gran clase de ecuaciones diferenciales, incluyendo la de calor, la de la cuerda vibrante y las ecuaciones de ondas electromagnéticas. Se puede ver que las funciones de onda (4.10-10) asociadas con un pozo de potencial infinitamente profundo, satisfacen las condiciones de ortogonalidad ya que, como se sabe y se puede comprobar fácilmente,

f

mnx nnx sen - - sen - - dx = O. L L 0 L

(m -:F n)

(4.13-9)

Aunque es más difícil hacer la misma demostración para el pozo finito y para el oscilador armónico, es cierto que las funciones de onda (4.11-5, 6, 7) y (4.12-30) que pertenecen también a estos sistemas son también ortogonales. 1 0 Supóngase ahora que se tiene un conjunto infinito de funciones propias 1/Jn(x) que son soluciones a la ecuación de Schrodinger para un potencial dado V(x). Ya se dijo que estas funciones propias deben ser ortogonales y normalizadas de acuerdo con (4.8-10), de manera que obedecen a (4.13-1). Se pueden combinar estas funciones propias en una superposición lineal, de modo que la suma represente una función arbitraria de x, sujeta a ciertas restricciones matemáticas que no son muy severas. Para entender cómo se hace esto, supóngase que una función arbitraria f(x) se puede representar como la combinación lineal de las funciones propias de tal manera que <Xl

f(x) = Al multiplic
L ant/Jn(x). n=O

1/J~(x)

(4.13-10)

e integrar, se encuentra que

(4.13-11) En la suma, todas las integrales son cero por virtud de (4.13-1 ), excepto aquella para la que n = m, que da un valor de am. El resultado final es

(4.13-12) Si se substituye este valor en lugar de am ( 4.13-1 0), es obvio que f(x) se puede respresentar como

(4.13-13) en donde la variable ficticia de integración x' se substituyó con x para evitar confusiones. Para las funciones propias senoidales de la sección 4.1 O, sucede que, esta expansión es simplemente una expansión de serie de Fourier. Se pueden efectuar 10

/bid., página 219. Véase también R. V. Churchill, Fourier Series and Boundary Value Problems, McGraw-Hill, Nueva York (1941), páginas 46-52.

122 Mecánica cuántica. Generalidades expansiones similares en términos de las funciones de Hermite asociadas con el oscilador armónico, y en términos de otras funciones de onda relacionadas con otras funciones de potencial. En la sección 4.9 se vio un ejemplo de una situación en la que los valores propios y las funciones propias están distribuidos en una forma continua, en lugar de discreta. En este caso se encontró que una función arbitraria se podía representar como una combinación de integrales de las funciones propias, de la forma de una integral de Fourier. Este resultado se puede extender a las funciones propias que representan cualquier sistema cuyos valores propios tienen una distribución continua, y el resultado se puede expresar como la ecuación (4.13-13) en el límite en el que los valores propios se amontonan o concentran, después de lo cual la suma en dicha ecuación se convierte en integral. Aunque esta representación integral es importante y hay que mencionarla como dato complementario, no se analizará en detalle, ya que no se utilizará en esta sección. Su aplicación al caso de las funciones propias de la partícula libre puede verse con claridad en la exposición de la sección 4.9. La combinación lineal de las funciones propias tales como (4.13-1 O) no constituye una solución a la ecuación de Schri:idinger, independiente del tiempo relacionada con algún valor particular de energía en, ya que ha perdido la forma (4.8-7); pero, una combinación lineal de las funciones propias dependientes del tiempo de la forma

f(x,t)

00

00

n=O

n=O

= L an'1' n<x,t) = L ani/Jix)e-i""''ll,

(4.13-14)

que se reduce a (4.13-10) para t =O, es efectivamente una solución para la ecuación de Schri:idinger dependiente del tiempo, (4.7-3). Esto se puede verificar de un modo directo con gran facilidad considerando el hecho de que las funciones propias independientes del tiempo 1/Jn obedecen siempre, de acuerdo con (4.8-8), a la relación .tf 1/Jn =En 1/Jn. Esto permite ver que, aunque se puede construir una superposición de funciones de onda, que obedezcan a la ecuación de Schri:idinger dependiente del tiempo, para representar cualquier función o amplitud de probabilidad en un instante dado (t = O en el ejemplo anterior), en general, la superposición de las funciones de onda no stgue representando esa misma función o amplitud de probabilidad en tiempos posteriores, debido a las diferentes dependencias del tiempo de las componentes individuales de dicha superposición. Así pues, una superposición de funciones de onda no representa por lo general un estado estacionario del sistema. Este tema ya se tocó en la sección 4.8. Si una superposición de funciones propias, tales como (4.13-14), va a utilizarse como cualquier tipo de función de onda para un sistema físico, es necesario normalizarla para que satisfaga ( 4. 7-6). Por tanto, para funciones de onda de la forma (4.13-14), se debe tener

(4.13-U)

En vista de los establecido por {4.13-1 ), todos los términos de la doble suma son cero, excepto aquellos para los que m = n, en donde el valor de la integral es igual a la unidad. En consecuencia, se encuentra que el requisito de normalización quedará satisfecho a condición de que los coeficientes se escojan de tal modo que

(4.13-16)

Valores esperados y números cuánticos 4.14

123

VALORES ESPERADOS Y NUMEROS CUANTICOS

Supóngase que se hace un gran número de mediciones de una cantidad física f que es una propiedad de un sistema dinámico dado. Estas mediciones se hacen siempre sobre el mismo sistema o en sistemas idénticos que se encuentran siempre en el mismo estado. Si se conserva la propiedad f, es decir, si es constante con respecto al movimiento de dicho sistema, entonces (dentro del error experimental que se supondrá despreciable), se obtendrá el mismo valor de f en cada medición, y si se traza una gráfica de la frecuencia P(j) df con que se obtiene un valor medido en un rango df alrededor de f, será simplemente un "pico" localizado en un valor dado / 0 , que constituye el valor esperado
P(f)

p (f}

fo

( = l

(al Figura 4.19.

(b}

(a) Distribución estadística de muchas determinaciones relativas a una cantidad que es una constante del movimiento (b) Distribución análoga Lurrespondiente a una cantidad que no es una constante del movimiento.

le donde, (12

<12> - 2(/)(f) + 2 = - (!)2. =

(4.14-2)

124

Mecánica cuántica. Generalidades

Uno de los postulados fundamentales es que el valor esperado de una cantidad dinámica está dado por

= f~"' 'P*fop'P dx,

(f)

(4.14-3)

en donde fop es el operador correspondiente a la variable dinámica f y en donde 'IJ1 representa la función de onda del sistema para el que se mide f Ahora se investi· garán ciertos valores esperados relacionados con el operador de energía (- h/iXofot), primeramente, para un sistema en uno de sus estados propios, y luego para el mismo sistema en un estado que se representa como una superposición de dos estados propios. En primer lugar, es obvio que para cualquier sistema, el valor esperado de energía (e), se puede calcular a partir de la función de onda dependiente del tiempo 'IJ!(x,t) por medio de (4.14-3), utilizando también (4.7-4). El resultado es

(e)

= f oo

o'P)

-oo

Ji 'P* ( --:--;-dx, 1 ut

= foo

_ 00

'P*.Jf'P dx

= ($).

(4.14-4)

El valor esperado de la energía es, entonces, el mismo que el del operador hamiltoniano evaluado sobre las funciones de onda dependientes del tiempo. Si 'IJ!(x,t) es una función de onda que representa un estado propio estacionario del sistema y que, por tanto, tiene la forma ( 4.8-7), ( 4.14-4) se puede expresar como sigue (4.14-5) El valor esperado del operador hamiltoniano y, por ende, de la energía es, en este caso, el mismo cuando se toma sobre las funciones de onda independientes del tiempo 1/J(x), o bien, que sobre las funciones dependientes del tiempo 'IJ!(x,t). Puesto que :Tf, de acuerdo con (4.7-5), es un operador independiente del tiempo, no opera en factores de tiempo en (4.14-5); por tanto, estos factores se pueden mover más allá del operador :lf y cancelarse entre sí. Si la función de onda 'IJ!(x,t) es una superposición de las funciones propias de estado estacionario de la forma ( 4.13-14),

'P(x,t)

= L anl/ln(x)e-ient!A,

(4.14-6)

" entonces, de acuerdo con (4.14-4), observando nuevamente que :lf no opera sobre los factores de tiempo, (4.14-7) Si se usa (4.8-8), que indica que :1ft/In= Ent/ln, se tiene

(e)

= L L e"e-i(en-em)t/A m

n

f"' -oo

a!anl/l!l/ln dx,

(4.14-8)

Valores esperados y números cuánticos

125

que, en vista de la propiedad de ortogonalidad de las funciones propias, se reduce a (4.14-9) todas las integrales de (4.14-8) desaparecen excepto aquellas para las que m= n. Sin embargo, este es el mismo valor que se obtuvo tomando el valor esperado del operador hamiltoniano Yf sobre la función de onda independiente del tiempo

t/l(x) = 'l'{x,O) =

L a.t/l.(x),

(4.14-10)

porque entonces, utilizando ( 4.8-8) y las propiedades de ortogonalidad de las funciones propias,

=

L L a!a.e. foo t/l!t/1. dx = L a:a.e. = m

n

-oo

(e).

(4.14-11)

n

El operador Yf que opera sobre la función independiente del tiempo (4.14-10), es por tanto, totalmente equivalente al operador (-h/iXofot) que opera sobre la función dependiente del tiempo (4.14-6). Cuando se calculen los valores esperados para funciones de ondas superpuestas, se usará este resultado que se debe a la independencia del tiempo del operador Yf y la ortogonalidad de las funciones propias. Si el sistema se encuentra en uno de sus estados propios estacionarios, su función de onda es 1/Jn(x), y, de acuerdo con (4.14-5),

(e)= (Jt") =

f~oo .¡,:Jt"t/1. dx = f~oo .¡,:(e.t/1.) dx =e. f~oo t/l:t/1. dx =e•. (4.14-12)

De igual manera, el valor esperado de e2 se puede determinar evaluando el operador correspondiente independiente del tiempo :lf 2 sobre la función de onda independiente del tiempo,l 1 según lo cual

La desviación estándar asociaJa con una serie de determinaciones de energía sobre un sistema, en uno de sus estados propios estacionarios será, de acuerdo con (4.14-2), (4.14-12) y (4.14-13) (4.14-14)

11 Estrictamente hablando, este enunciado se debe (y se puede) demostrar mediante los métodos usados para derivar (4.14-9) y (4.14-11).

126 Mecánica cuántica. Generalidades Entonces, se obtendrá una distribución "pico" en donde cada medición dará el mismo valor de energía en. Ahora se supondrá que la función de onda del sistema es una superposición de dos funciones propias, de la forma (4.14-15) de tal manera que (4.14-16) en donde, de acuerdo con (4.13-16), (4.14-17) El valor esperado de la energía se puede evaluar ahora calculando el valor esperado del operador :if sobre la función de onda (4.14-16). Por supuesto, los resultados se pueden obtener como un caso especial de (4.4-11),.por ló cual (4.14-18) en donde and

:ff 2

1 -a.= a:an.

(4.14-19)

Del mismo modo, el valor esperado de e2 se puede determinar evaluando y empleando la función de onda (4.14-16), lo cual da (.Yt' 2 ) =

=

f~.., (a!t/1! + a:t/f:)Jf.Yf(amt/Jm + ant/Jn) dx

f~..,a!amt/J!.Yf(.Yft/lm) dx + f~.., a:ant/J:.1f(.Yft/ln) dx + f~.., a!ant/J!.Yt'(.1ft/ln) dx + f~oo a:amt/J:..it'(.rt't/lm) dx.

(4.14-20)

Sin embargo, .rt'l/lm = em 1/lm y Hl/ln =en 1/ln; al aplicar estas fórmulas dos veces a cada una de las cuatro integrales de ( 4.14-20) se obtiene

(4.14-21) Las dos primeras integrales de (4.14-21) son la unidad y las otras dos son cero, debido a la ortogonalidad de las funciones propias 1/Jn. La ecuación se reduce. en este caso, a (4.14-22)

Valores esperados y números cuánticos

127

La desviación estándar asociada con mediciones de energía en un sistema cuya función de onda es la superposición (4.14-15), es

(4.14-23) La desviación estándar es cero sólo cuando a = O, a = 1, ó em = en; en cada uno de estos casos, la función de onda ( 4.14-16) se reduce a una sola función propia del sistema. Sin embargo, en general, se tendrá cierto "despliegue" relacionado con mediciones de energía de un sistema de esta índole, en donde las determinaciones no dan siempre el mismo valor de energía. En realidad, si se piensa un

P(•)

Figura 4.20.

Distribución estadística de energías para sistemas cuyas funciones de onda son superposiciones de las mésima y nésima funciones propias

poco, se verá que la distribución de frecuencia de "dos picos" de la figura 4.20 coincide con los valores de (e) y (e 2 ) dados por (4.14-18) y (4.14-22). Si se estudian los valores esperados de potencias más altas de e, se llegará a la conclusión de que sólo esta distribución es consistente con todos los valores esperados. 12 En la actua\\d.ad., \a \n.terpretadón. -pteva.\ec¡,den.te de este resultado es o,.ue, cuando se mide la energía en un sistema, el acto mismo de la medición hace que el sistema pase a uno de sus estados propios, si no está ya en uno de ellos, y que la probabilidad de que el valor medido de la energía esté asociado con uno u otro estado propio, es propor.::ional a la cantidad a~am relacionada con el estado propio en la función de onda de superposición. Si la cantidad a 2 asociada con el valor esperado de cierta cantidad dinámica es .::ero, se dice que esa cantidad se conserva en el movimiento o que es una constante del movimiento. De acuerdo con (4.14-14), es evidente que se conserva la energía de "Jn sistema en uno de sus estados propios. Si se puede encontrar un operador A con la propiedad de que (4.14-24)

12

C. W. Sherwin, op. cit. páginas. 118-122.

128 Mecánica cuántica. Generalidades en donde An es una constante, se dice que An es un valor propio del operador A. Para tal operador, (4.14-25) y

(4.14-26) por lo cual, (4.14-27) y la cantidad dinámica representada por A se conserva, y el valor esperado del operador A está dado por el valor propio An· Evidentemente, el operador hamiltoniano Jf es tal, que sus valores propios son las energías En· Cualquier otro operador A, que posea la propiedad (4.14-24) con respecto a las funciones propias del sistema, conmutará siempre con el operador hamiltoniano, es decir, siempre se encontrará que

AJf =ffA,

(4.14-28)

Jt' Al/In= Jt'().nl/ln) = AnJfl/ln = AnBnl/ln

(4.14-29)

A.tfl/ln = A(enl/ln) = enAI/1. = enA.nl/ln = ff Al/In·

(4.14-30)

ya que, entonces,

y

La inversa de este enunciado es verdad también; si un operador A conmuta con el operador hamiltoniano, como sucede en (4.14-28), el operador tiene la propiedad ( 4.14-24) con respecto a las funciones propias 1/1 n, y la variable dinámica que representa es una constante del movimiento ya que en este caso se satisface ( 4.14-27),13 Cuando se trata de sistemas más complejos, tales como el átomo de hidrógeno, que se estudia en la siguiente sección, las relaciones (4.14-24) y (4.14-28) son muy útiles para demostrar que ciertas cantidades dinámicas son constantes del movimiento. Se constatará, recurriendo a (4.14-24), que el total de la cantidad de movimiento angular orbital del electrón dentro del átomo de hidrógeno, y su componente z, son constantes del movimiento.

4.15

EL ATOMO DE HIDROGENO

El átomo de hidrógeno es un sistema compuesto de un protón y un solo electrón que interactúan como resultado de su atracción electrostática mutua. El potencial clásico de este sistema es, sencillamente,

V(r) = - e2 /r,

(4.15-1)

13 Si se desea ver la demostración inversa ·de esta expresión, véase E. Merzbacher, op. cit., página. 160.

El átomo de hidrógeno

129

en donde e es la carga electrónica y r la distancia entre el electrón y el protón. En este estudio se considerará que la masa del protón es infinita en comparación con la del electrón. En esta aproximación, cualquier movimiento del protón puede considerarse como despreciable, ya que se supone que el movimiento es el que realiza el electrón alrededor de un núcleo fijo. Puesto que la masa del protón es alrededor de 1850 veces la del electrón, esta aproximación es aceptable. El movimiento del protón se puede tomar en cuenta si se utiliza una masa reducida, como se hizo en el análisis de la sección 4.5 en relación con el átomo de Bohr. Considerando la simetría esférica del potencial (4.15-1) conviene usar el sistema de coordenadas esféricas ya conocido, donde

x = r sen Ocos rjJ y = r sen Osen rjJ

z = r cosO, r

X

Figura 4.21.

Sistema de coordenadas esféricas utilizadas en el estudio del átomo de hidrógeno.

como se ilustra en la figura 4.21, en donde se puede escribir la ecuación independiente del tiempo de Schrodinger como (4.15-2) con (4.15-3)

En (4.15-2), m 0 representa la masa del electrón. Se puede proceder mediante la técnica ya conocida de separación de variables, en la que se supone que las soluciones tienen la forma

1/J(r,O,r/J)

= R(r)E>(O)<'P(r/J),

(4.15-4)

130

Mecánica cuántü:::. Generalidades

en donde R(r) es una función de r solamente, independiente de 8 y 1/>; 8(8) es una función sólo de 8, y cl>(if>) es una función exclusiva de 1/>. Al substituir esta forma para la solución, en (4.15-2), observando que 3¡J¡f3r = 0cl> dR/dr, 31/1/38 = Rcl> d0/d8 y 31/1/31/> =R@Jd~/dl/>, multiplicando la ecuación resultante por r2 sen 2 8/(R~), y transponiendo, se tiene que

Puesto que la expresión de la izquierda, que es una función solamente de r y 8 es igual a otra expresión que es una función exclusiva de 1/>, las dos expresiones se deben igualar por separado a una constante que, por razones que se verán en breve, se representará por medio de m 2 . A continuación se limitará el estudio, por un momento, a la última igualdad que aparece en (4.15-5). Esta se puede reacomodar ligeramente de tal modo que se lea (4.15-6)

que es una ecuación diferencial cuya solución se puede escribir como sigue (4.15-7)

Puesto que la función de onda completa ¡J¡ debe tener un solo valor, es necesario que cl>m(l/>) tenga un solo valor también. En otras palabras, es necesario que (4.15-8)

por lo que, de acuerdo con (4.15-7),

o bien, e±2,.mi =l.

(4.15-9)

Esta condición se puede satisfacer sólo si m es un entero positivo o negativo o bien, cero. Los valores permisibles de m están limitados, entonces, a

m= O, ±1, ±2, ±3, ···, de otra manera, la función de onda tendrá múltiples valores. Ahora se comprenderá por qué la constante de separación se escogió de tal manera que se representara mediante m 2 • Si m es un número real, entonces m 2 debe ser positiva. Si la constante de separación de ( 4.1 S-5) hubiera sido negativa, las soluciones ( 4.1 S-7) habrían sido exponenciales y no sinusoidales y la condición de valor único (4.15-8) nunca se habría satisfecho. Así pues, la constante de separación se escogió de este modo para asegurar que tendría siempre un valor positivo y, por ende, excluyera inmediatamente las soluciones indeseables.

El átomo de hidrógeno

131

En (4.15-5), la expresión de la izquierda se puede igualar a m 2 , y la ecuación resultante dividirse entre sen 2 fJ y reacomodarse en tal forma que se exprese como sigue

1d (r2 R dr

dR) dr

-

2

2

0r ( e) +2m- e+li 2 r

dE>) = - - -1- - sde( n ( ) E> sen O d() d()

2

m =fJ, +-sen 2 () (4.15-10)

Una vez más, puesto que la primera expresión es una función exclusiva de r y la segunda lo es sólo de fJ, las dos deben ser iguales, independientemente, a una constante {3. La segunda igualdad de (4.15-10) se puede escribir en la forma

1 d ( dE>) m 2 E> sen() dO sen() d() - sen 2 ()

+ {JE>(O) =

O.

(4.15-11)

Esta ecuación es muy conocida en la física matemática y se denomina ecuación de Legendre. Sin entrar en muchos detalles matemáticos, 14 se observará que las únicas soluciones de esta ecuación que no violan los requisitos de lo fmito para las funciones de onda son aquellas para las que {3 tiene valores de O, 2, 6, 12, 20, • • • , de donde, para aquellas en que

fJ = l(l + 1)

con

(l = 0,1,2,3, · · · ).

(4.15-12)

En estos casos, las soluciones de (4.15-11) se reducen a un polinomio en cos fJ y sen fJ más o menos en la misma forma en que las soluciones de la ecuación de Hermite se reducen a polinomios en ciertas condiciones. Estas soluciones polinómicas se pueden representar como las funciones asociadas de Legendre P'f(8), definidas por dlml Pr(()) =senlml () d(cos O)lml P,(cos O)

(4.15-13)

1 d 1(cos 2 ( ) - 1)' P,(cos ()) = 211! d(cos 6)1

(4.15-14)

en donde

Las funciones P1 (cos fJ) son las llamadas polinomios de Legendre, las primeras de las cuales son P 0 (cos O)= 1 P¡{COS ()) = cos () (4.15-15)

P 2 (cos O)= t(3 cos 2

()-

1)

P 3 (cos 9) = !(5 cos 3

()-

cos 9)

etc.

14 Por ejemplo, véase R. B. Leighton, Principies o[ Modern Physics, McGraw-Hill Book Co., Inc., Nueva York (1959), página 168.

132

Mecánica cuántica. Generalidades

Por supuesto, cuando m= O, las funciones asociadas P?(e) se reducen a los simples polinomios de Legendre P1( cos 8). La función E>( 8) de ( 4.15-11) se escribe casi siempre en la forma 0 (8)

= J(2l +

l)(l- m)! pm(e) 2( 1 + m) ! 1 ,

lm

(4.15-16)

siendo el factor de multiplicación Pf(8) una constante de normalización. La parte angular de la función de onda, representada como un producto de 8 1m(8) y m(cf>) se escribe con frecuencia en la siguiente forma

= ( -l)m

J(

21

+ 1)(l- m)l. Pr(e)eim<J>.

4n(/ +m)!

(4.15-17)

Las funciones Y 1m (e ,e/>) se conocen como armónicas esféricas. Para una fuerza central en donde el potencial es una función exclusiva de r, la parte angular de la función de onda está dada siempre por ( 4.15-17), sea cual fuere la forma particular que tome V(r). La porción radial de la ecuación ( 4.15-1 O), tomando ~ = l(l + 1) como lo requiere ( 4.15-12), se convierte ahora en _1_ .!!_ (r 2 dR) + 2m 0 (s + e 2 )R(r) _ 1(1 + 1)R(r) =O. r r2 r 2 dr dr li 2

(4.15-18)

Esta expresión se denomina ecuación de Laguerre. Las soluciones cuyo comportamiento en r = oo permite calificarlas como funciones de onda, son aquellas que se pueden expresar en términos de los polinomios de Laguerre. Estas funciones con las que se asocia un conjunto discreto de valores propios de la energía E, se pueden expresar como sigue _ _

Rnl(r)-

[(2 nli2 2)3 moe

(

. n- 1 (2n[n +

1)' ]1/2 e ·

/] !)3

-p¡z 1 zt+ 1 p Ln+l (p),

(4.15-19)

en donde 11 =

1,2,3, ....

(4.15-20)

y en donde (4.15-21) Las funciones L ~':/(p) son funciones asociadas de Laguerre, definidas por ds

L~(p) = -1S L,(p),

(p

(4.15-22)

en donde Lr(P) son los polinomios de Laguerre que, a su vez, se definen como L,(p)

= eP

d' - ,(p'e-P). (1p

(4.15-23)

El átomo de hidrógeno

133

Las energías en para las que existen funciones de onda aceptables están relacionadas con los valores de n en (4.15-19) por medio de 15 (4.15-24) La ecuación ( 4.15-24) para los niveles de energía del átomo de hidrógeno concuerda con el resultado ( 4.5-8) de la teoría de Bohr; los niveles energéticos, según se ilustran en la figura 4.5, y dados por la teoría de Bohr son los mismos que los que predice la mecánica ondulatoria. Existen tres números cuánticos, n, l y m en el planteamiento de la mecánica ondulatoria para el átomo de hidrógeno. Los valores posibles de n están dados por (4.15-20). Los polinomios de Laguerre Lr(P) de (4.14-23) se pueden identificar como polinomios de grado r. Estos polinomios se pueden derivar sólo r veces antes de que el resultado de la derivación repetida dé cero como resultado. De donde, para las funciones de onda que no sean cero de la forma que se puedan obtener del polinomio Lr, el número de derivaciones s necesarias para generar la función asociada de acuerdo con (4.15-22), debe ser igual o menor que r. Entonces, para funciones de onda con significado físico, es necesario tener en (4.15-22)

L:,

L:

s ~ r,

(4.15-25)

21 + 1 ~ n +l.

(4.15-26)

o, en (4.15-19)

Si se resta l

+1

en ambos lados de esta desigualdad, (4.15-26) se reduce a l~n-1.

(4.15-27)

De igual manera, la función asociada de Legendre P{'(fJ) se obtiene del polinomio de Legendre P1(cos fJ) mediante una derivación de m veces. Para una función de onda distinta a cero de la forma P{'(fJ), el número de derivaciones m debe ser igual o menor que el grado l del polinomio. Por tanto, se debe tener (4.15-28) para funciones de onda de interés físico. Las condiciones expresadas en (4.15-20), ( 4.15-27) y ( 4.15-28), sirven para definir las expresiones bien conocidas para el rango posible de valores correspondientes a n, l y m,

n = 1,2,3,4, ··· l = 0,1,2,3, ··· n- 1

(4.15-29)

m =0,±1,±2,±3, ···±l. Por lo común los estados para los que l = O, 1, 2, 3 se mencionan como estados s, p, d y f, respectivamente. Así pues, para indicar un estado para el que n = 2 y l =O, se dice estado 2s, en tanto que uno con n = 3 y l = 2 se representa como estado 3d. 15 Los detalles matemáticos de este desarrollo están dados por R. B. Leighton, op. cit., páginas. 171-17 5.

134 Mecánica cuántica. Generalidades Las funciones de onda completas para el átomo de hidrógeno, de acuerdo con lo establecido en ( 4.15-4), deben ser

(4.15-30) en donde Rn 1(r), E>,m(l1>, y <~~m(C/>) son según lo establecen, respectivamente, (4.15-7), (4.15-16) y (4.15-19), y en donde Nnlm es una constante de normalización seleccionada en tal forma que

f

1/J:,ml/lnlm · r 2senO dr dO df/J

(4.15-31)

=l.

Se encuentra que las funciones de onda (4.15-30) son ortogonales, de modo que

f

1/J:I'm'l/lnlm · r 2 senO dr d(J df/J

(4.15-32)

=O,

a menos que n = n', l = l' y m= m' simultáneamente. Las funciones de onda dependientes del tiempo se o_btienen a partir de las funciofles independientes del tiempo y multiplicándolas por e- 1 ent/fl. TABLA 4.1. Funciones de onda del átomo de hidrógeno m=O

.P1oo

1=0 1=1 (4 estados)

m=O m=O m=±1

.P2oo = N2oo(2- p)e-'hP .P21o = N21ope- 'hP cos 8 .P21±1 = N211pe-~'>P sen8 e± 1"'

1=0 1= 1

m=O m=O m=±1 m=O m=±1 m=±2

.P3oo = N3oo(6- 6p + p2)e- 'hP .P31o = N31op(4- p)e- 'hP cos 8 .P3t±1 = N311p(4 -p)e-'l.zP sen8 e± 1• .P32o = N32op 2e_ 'hP(3 cos 2 8- 1) .P32± 1 = N321p 2e- 'hP sen8 cos 8 e± 1"' if¡ 32 ±2 = N 322 p2e- 'lzP sen 2 8e±Z1"'

m=O m=O m=±1 m=O m=±1 m=±2 m=O m=±1 m=±2 m=±3

.P4oo = N4oo(24- 36p + 12p 2 - p3)e- 'hP 4s .P4to = N4tope- 'hP(20- 10p + p2) cos 8 } 4p3 .P4t±l = N411pe-'lzP(20- 10p +p 2) sen8 e± 14> .P4zo = N42oP 2(6 -p)e- 'hP(3 cos 2 8- 1) .P42±1 = N42tP 2(6 -p)e-'hPsen8 cos 8 e± 1• .P4z±Z = N4••P 2(6- p)e-'l.zP sen 2 8 eu 1• .P43o = N43op 3e-'hP(j-cos 3 8- cos 8) .p43±1 = N43tp 3e- 'h•(5 cos 2 8- 1) sen 8 e± 1"' .P43±2 = N432p 3e-'h.Psen 2 8 cos 8 e± 21 "' .P43±3 =N433p 3e-'hPsen 3 8 e± 3'"'

n=1

1=0

n=2

n=3

1=2

(9 estados) n=4

1=0 l= 1

1=2

1=3

(16 estados)

N

nlm

=

1s

Nlooe-'hP

2s } 2p3 3s

} 3p3

) 3d'

)4d'

}·;,

= _ [ cmoe 2 ) 3 (n -1- 1)!(/- m)!(2/ + nli'

4rr(2n[n + /]!) 3(/ + m)!

1)]'/.z

El átomo de hidrógeno

Figura 4.22.

135

Representaciones fotográficas de la densidad de electrones asociada con varios estados propios del átomo de hidrógeno. El eje polar yace sobre el plano de la página y está orientado verticalmente.

De acuerdo con (4.15-24), es evidente que la energía depende sólo del número cuántico principal n de este sistema particular. Existen muchos estados cuánticos independientes [correspondientes a los diversos valores permisibles para l y m, de acuerdo con (4.15-29)], que tienen el mismo número cuántico principal n y que, por tanto, pertenecen al mismo nivel de energía. Este fenómeno se conoce como degeneración y un nivel energético que contiene más de un estado cuántico independiente se conoce con el nombre de nivel degenerado. Gracias a ( 4.15-29), se puede ver mediante un simple recuento de los estados, que la degeneración o multiplicidad asociada con el nivel de energía En, cuyo número cuántico principal es n, es simplemente n 2 • Las expresiones algebraicas para algunas de las funciones de onda del átomo de hidrógeno se ilustran en la tabla 4.1 y, en la figura 4.22 se muestran algunas representaciones de la densidad de probabilidad de algunos de estos estados. Se observará que los estados s- (l = O) son siempre esféricamente simétricos, en tanto que los estados p-, d- y f, etc., tienen dependencias angulares que pueden ser muy complejas. El estado 2p- para el que m = O, tiene dos lóbulos que señalan hacia las direcciones ± z, en tanto que los estados 2p- para los que m = ± 1 tienen la forma de "ondas" y son simétricos alrededor del eje z. Por tanto, todos los estados 2p-

136

Mecánica cuántica. Generalidades

Figura 4.22.

(continúa). La escala no es uniforme en todos los diagramas. [Tomado de R. B. Leighton, Principies of Modern Physics, McGraw-Hill, Nueva York (1959).]

tienen amplitudes de probabilidad que son simétricas alrededor del eje z. Se podría preguntar cuál es la razón de esta aparente preferencia por el eje z. Después de todo, el potencial V(r) es esféricamente simétrico, lo cual permite en primer lugar escoger cualquier eje polar del sistema de coordenadas esféricas, y se seleccionó éste de un modo puramente arbitrario. Entonces, ¿por qué parece que este aspecto es en apariencia preferible o, más concisamente, se prefiere en realidad este eje en un sentido físico? En la sección 4.13 se hizo notar que las superposiciones lineales de las funciones ondulatorias en estado estacionario que pertenecen a diferentes niveles de energía, no representan amplitudes de probabilidad que son independientes del tiempo. Puesto que las diversas funciones propias de estado estacionario independientes que pertenecen al mismo grado energético degenerado tienen el mismo factor de dependencia del tiempo e-iEntffi, sin embargo, se sigue que los estados de esta naturaleza pueden superponerse y la amplitud de probabilidad de la superposición sigue siendo independiente del tiempo. En la sección 4.10 se vio un ejemplo de este tipo [en relación con la ecuación (4.10-13)]. Por ejemplo, de acuerdo con la tabla 4.1 y (4.15-29) es evidente que existen tres estados independientes 2p para el átomo de hidrógeno. No obstante, no existe ninguna diferencia si se considera que

El átomo de hidrógeno

137

estos estados son los mismos que se indican en la tabla 4.1 ó si se les toma como tres superposiciones linealmente independientes de dichos estados. Mediante la superposición adecuada de los tres estados dados en la tabla 4.1, se podrían producir tres funciones de onda independientes en superposición, que correspondan a las amplitudes de probabilidad con lóbulos que señalen a lo largo de los ejes x-, y- y z-, en lugar del lóbulo polar y la configuración en "dona" de las funciones de la tabla. Si se hace una superposición lineal adecuada y subsecuente de estas tres funciones de onda, se puede hacer que estos tres lóbulos señalen en cualquiera de tres direcciones ortogonales dadas. Esto demuestra que las funciones de onda de la tabla 4.1, en las que un eje polar arbitrariamente escogido parece tener un grado único o preferencial, forman sólo una representación de las funciones de onda del sistema y que, a través de la superposición correcta de estados cuánticos degenerados, se podría formar una representación en la que el eje polar estuviese en alguna otra dirección. Además, por supuesto, si así se deseara, se podría superponer el estado 2s a lo largo de los tres estados 2p. No obstante, no se podría sumar en un estado 3s o 3p y seguir conservando una amplitud de probabilidad independiente del tiempo.

o3/2R/Z o

3/2

2 1

o

Figura 4.23.

k

R 10

~

1

1

10

15

Gráficas de la función de onda radial Rn¡(r) correspondiente a 11lgunos estados del átomo de hidrógeno. [Tomado de R. B. Leighton, Principies of Modern Physics, McGraw-Hill, Nueva York (1959).]

En la figura 4.23 se muestra una gráfica de la función de onda radial Rn¡(r) para varios de los estados de energía más bajos del átomo de hidrógeno, y en la figura 4.24 se muestra una gráfica de la densidad de probabilidad radial, que es la probabilidad de encontrar al electrón dentro de una capa esférica de un espesor dr, alrededor del radio r. Puesto que el volumen de una capa de esta naturaleza es,

138 Mecánica cuántica. Generalidades 47rr2 dr, la densidad de probabilidad radial debe ser proporcional a r 2 R~ 1nl(r). 1

demostración de este aserto se propone como ejercicio para el lector. Los máxim< en la densidad de probabilidad radial para las funciones de onda s, como se ilust1 en la figura 4.24, son muy semejantes (aunque no idénticas) a los radios de Bot rn, según lo establece (4.5-4). Ya se observó, gracias a la ecuación (4.15-24), que el número cuántico pri1 cipal n está asociado con la energía total del sistema. Más tarde se verá que 1< números cuánticos 1 y m están relacionados con la cantidad de movimiento angul: del sistema. En el movimiento planetario clásico se conserva la cantidad de mov

25 Zr

o; Figura 4.24.

Gráficas de la distribución de probabilidad radial r2R~ 1 (r) para algunos estado~ d átomo de hidrógeno. [Tomado de R. B. Leighton, l'rinciples of Modern Physic McGraw-Hill, Nueva York (1959).]

miento angular orbital. Como se verá en breve, esto se aplica también al plante: miento de la mecánica cuántica. La cantidad de movimiento angular clásica L de ur partícula se define por medio de

L = r X p,

(4.15-3:

en donde p es la cantidad de movimiento lineal y r es el vector de radio a partir d un origen arbitrario hasta la partícula. De acuerdo con esta definición y el enur ciado de los operadores de cantidad de movimiento lineal (4.7-2), se puede construJ de un modo muy directo un conjunto de operadores que representen las comp< nentes cartesianas de una cantidad de movimiento angular. El resultado es

L

L

y

=zp" -xpz =~[z~-x!_] i OX oz

z

=xpy -yp" =~[x!_-y!_] i iJy ox .

(4.15-3~

El átomo de hidrógeno

139

Estos operadores se pueden expresar de acuerdo con las coordenadas esféricas (r, O, cp) mediante una transformación de coordenadas directa, pero tediosa. En este caso, los operadores se convierten en L

x

li[

a - ctn () cos "~',¡,. -a<Pa] = -¡ - sen "~',~,. -ao

L =

~¡ [cos ,¡,."~' ao0 -

L.=

i a


'

ctn Osen,¡,.~] "~'

(4.15-35)

a
li a

El operador que representa el cuadrado del total de la cantidad de movimiento angular se puede obtener a partir de (4.15-3 5) como 2

2

L = Lx

2 + L,2 +L.= -li

2[

a(

1 sen OoO sen()

a)

o 2

ao + sen12 Oa<jJ 2 ] •

(4.15-36)

A continuación se examinará lo que sucede cuando este operador opera sobre las funciones de onda 1/lnlm del átomo de hidrógeno, según lo indica (4.15-30). Se encuentra que (4.15-37) Sin embargo, el operador L 2 es independiente de r y opera sobre la función de onda producto (4.15-30) en tal forma que (4.15-37) se puede escribir como sigue (4.15-38) Si a esta expresión se aplican sucesivamente las relaciones (4.15-6), ( 4.15-11) y (4.15-12), es evidente que

(4.15-39) Esta ecuación demuestra que el operador L 2 es tal que tiene la propiedad especial dada por (4.14-24) con respecto a las funciones de onda 1/lnlm· En consecuencia, de acuerdo con (4.14-27) y (4.14-25), la variable dinámica asociada con el operador debe ser una constante del movimiento y su valor esperado es h2 l(l + 1). Así pues, se conserva el cuadrado de la cantidad del movimiento angular, por lo que la propia cantidad de movimiento angular debe conservarse, y el valor esperado de la cantidad de movimiento angular debe ser (L)

= J (L2 ) = lijl(l + t).

(4.15-40)

140 Mecánica cuántica. Generalidades

En forma similar, se puede demostrar que la componente z de la cantidad de movimiento angular se conserva también. En este caso, a partir de (4.15-35) y (4.15-30), se tiene que

Lzt/Jnlm =

li

a

li

¡ oc/J R",(r)E>,m(O)m(cP) = ¡ R",(r)E>,m(O)

am

oc/J •

(4.15-41)

Sin embargo, ocfJm/ocp = imeím


L,="Íi f¡

Figura 4.25.

1=0

/= 1

/=2

L=O

L="Íiff L,=O, ± "Íi

L="Íi {6 L,=O,±"Íi ±2"Íi

Posibles orientaciones para el vector de cantidad de movimiento angular bajo las restricciones impuestas por (4.15-40) y (4.15-43) para l =O, 1 y 2.

El espín electrónico

141

orbital) tendrá una interacción con el campo aplicado, de modo que el átomo experimentará una fuerza que trata de alinear al vector del momento magnético (y, por ende, el vector de su cantidad de movimiento angular orbital) con el campo aplicado. Por consiguiente, los estados cuyo valor de m permite una alineación par.:ial o completa, deben tener una energía más baja que los que corresponden a orientaciones casi antiparalelas. Los estados cuánticos que tienen dife¡entes valores de m, los cuales se degeneran en ausencia de un campo magnético, al aplicarles dicho ~po se dividirán en m niveles separados aunque muy proximos uno del otro. Este fenómeno se conoce con el nombre de efecto de Zeeman. Estos resultados sirven para explicar adecuadamente las propiedades eléctricas, magnéticas y espectroscópicas observadas en el átomo del hidrógeno. En principio, los átomos de estructura más compleja se pueden manejar con los mismos métodos; por otra parte, puesto que estos átomos representan sistemas de tres o más cuerpos, no se pueden obtener soluciones analíticas de forma cerrada, debido a lo cual es necesario recurrir a la teoría de perturbaciones. Un método de esta índole se basa en la técnica de dividir el operador hamiltoniano del sistema en una parte principal .:uya solución se conoce o se puede obtener analíticamente, y una parte más pequeña que contiene todos los términos que pueden originar dificultades analíticas. O, por lo menos la mayoría de ellos. Entonces, se supone que la solución tiene la forma de una combinación lineal de funciones propias de la primera parte del hamiltoniano y las constantes relacionadas con la combinación lineal se determinan de tal modo que la función de onda sea una función propia aproximada del hamiltoniano completo. Aunque estos métodos son muy útiles para resolver una gran ,·ariedad de problemas prácticos, no se analizarán aquí con más detalle. 16

4.16

EL ESPIN ELECTRONICO, EL PRINCIPIO DE EXCLUSION DE PAULI Y EL SISTEMA PERIODICO

En el cálculo de las funciones de onda y los niveles de energía de átomos con muchos electrones (He, Be, Li, etc.,) que se hace desde el punto de vista de la mecánica cuántica, generalmente se supone que cada electrón se mueve dentro de un potencial esféricamente simétrico, debido al núcleo y a una distribución espacial promedio de todos los demás electrones. En esta aproximación, la función de onda total del sistema se puede expresar como un producto de funciones de onda de un solo electrón. La función del potencial de cada electrón es esféricamente simétrica y la parte angular de las funciones ondulatorias de un solo electrón se pueden seguir expresando de acuerdo con los armónicos esféricos (4.15-17). No obstante, la porción radial de estas funciones de onda es más compleja que en el caso del átomo de hidrógeno. Debido a que las funciones de onda de un solo electrón pueden dividirse en sus partes radiales y angulares, cada electrón se puede considerar como representado por tres números cuánticos n, m y l, al igual que en el 1-tidrógeno. Sin embargo, puesto que la función radial de onda no tiene ya la forma (4.15-19), correspondiente a un simple potencial de Coulomb, los estados que tienen el mismo valor de n, pero un valor diferente de l, ya no están degenerados y la energía total del electrón depende del número cuán tic o orbital l así como de n. En vista de estas observaciones, los niveles de energía de átomos complejos se pueden calcular y ya se pueden hacer predicciones acerca de los espectros de dichos 16 Para obtener un estudio completo de este tema véase, por ejemplo, C. W. Sherwin, op. cit., capítulos 7-10 o bien, E. Merzbacher, op. cit., capítulos 16-20.

142

Mecánica cuántica. Generalidades

átomos. No obstante, estas predicciones no concuerdan por completo con la experiencia, a menos que se efectúen dos correccciones adicionales. La primera de éstas es la hipótesis del espín electrónico, que fue introducida por Goudsmit y Uhlenbeck en 1925, según la cual, cada electrón, además de la cantidad de movimiento angular orbital que tenga, debe poseer una cantidad de movimiento angular intrínseco o cantidad de movimiento angular de espín, de magnitud L 8 = -!-h..J3, cuya componente a lo largo de cualquier eje de campo dado puede tener dos valores posibles hm8 = ± h/2. En consecuencia, el electrón puede existir en dos "estados de espín" correspondientes a dos valores posibles de m8 • Estos dos estados de espín se mencionan con frecuencia como estados de "espín ascendente" y "espín descendente". Se puede considerar que el electrón tienen un número cuántico de cantidad de movimiento angular total del espín s, que sólo puede tener un valor de 1/2, en cuyo caso, análogamente a lo que establece (4.15-40), la cantidad de movimiento angular del espín es (L.) =

nJ s(s + 1) = nJ3¡2,

(4.16-1)

y un número cuántico m8 que representa la componente z de la cantidad de movimiento angular del espín que puede tener los valores ± 1/2, análogamente a (4.15-43), la componente z de dicha cantidad de movimiento es (L•• )

= m.ñ = ± ñ/2.

(4.16-2)

Así pues, la degeneración de todos los estados electrónicos que se producen en el hidrógeno y en átomos más complejos, se duplica debido a que haya dos estados del espín del electrón. La cantidad de movimiento angular intrínseca del electrón es una consecuencia de la relatividad y se obtuvo de los primeros principios cuando se formuló la ecuación de onda del modo covariante relativísticamente, como lo demostró Dirac en 1928. La incorporación del espín electrónico al formalismo de la mecánica ondulatoria en realidad no constituye ninguna suposición nueva en esta rama de la física. El otro factor que se debe introducir en la explicación del comportamiento de sistemas de muchas partículas, de acuerdo con la mecánica ondulatoria, es el principio de exclusión de Pauli, que establece que en un sistema dado (que puede ser un átomo, una molécula o todo un cristal compuesto de muchos átomos interactuantes), no hay dos electrones que puedan ocupar el mismo estado cuántico, considerándose los estados de espín opuestos como si fueran estados diferentes. Aplicándolo a un átomo complejo, el principio significa que no puede haber dos electrones en el átomo que posean los mismos números cuánticos, n, l, m y m8 • Para otros sistemas, esto significa que no puede haber más de g electrones que ocupen un nivel energético que se haya degenerado g veces. Aunque los electrones obedecen al principio de Pauli, hay otras partículas tales como los fotones, que no lo hacen. En general, las partículas tales como los electrones cuyo espín es múltiplo de (s = f, f, f, • • • ) obedecen al principio de Pauli, en tanto que otros, como los fotones cuyo espín intrínseco es entero (s =O, 1, 2 • • • ), no lo obedecen. Este hecho origina diferencias muy importantes en el comportamiento estadístico de los grupos de electrones y fotones, lo cual se verá en el siguiente capítulo. La adición del espín electrónico y ta principio de Pauli al planteamiento de la mecánica ondulatoria de átomos de muchos electrones, ayudó a explicar el sistema periódico de los elementos basándose en la ocupación sucesiva de los estados electrónicos de los átomos. Este enfoque se ilustra en la tabla 4.2, en donde se indica la configuración electrónica de cada átomo.

El espín electrónico

143

TABLA 4.2. Configuraciones electrónicas y el sistema periódico 1s 2s

H He Li Be B

e N

o F Ne 3s 3p

S Cl A

1s 2 )2s 2 2p 6)3s 1s 2 )2s 2 2p 6)3s 2 1s2)2s 2 2p 6)3s 23p 1s2)2s22p6)Js2Jp2 1s2)2s22p6)Js2Jp3 1s2)2s22p6)Js2Jp4 1s2)2s22p 6)3s2 3ps 1s2)2s22p6)Js2Jp6)

K Ca Se Ti V Cr Mn Fe Co Ni Cu Zn Ga Ge As Se Br Kr

1s 2 )2s 22p 6)3s 23p 6)4s 1s 2)2s 22p 6 )3s 23p 6 )4s 2 1s 2)2s 22p 6 )3s 23p 6 3d)4s 2 1s 2 )2s 2 2p 6 )3s 2 3p 6~d 2 )4s 2 1s2)2s22p6)Js2Jp6Jd3)4s2 1s2)2s22p6)Js2Jp63ds)4s 1s2)2s22p6)Js2Jp63ds)4s2 ls 2)2s 22p 6)3s 23p 63d6)4s 2 1s 2)2s 22p 6)3s 23p 63d 7 )4s 2 1s2)2s22p6)Js2Jp6JdB)4s2 ls2)2s22p6)Js>Jp6Jdlo)4s 1s2)2s22p6)Js2Jp6Jdlo)4s2 ls 2)2s 22p 6)3s 23p 63d 10)4s 24p 1s2)2s22p6)Js2Jp6Jdlo)4s24p2 ls2)2s22p6)Js2Jp6Jdlo)4s24pJ ls 2)2s 22p 6)3s 23p 63d 10)4s 24p 4 ls2)2s,2p6)Js2Jp6Jdlo)4s24ps ls 2)2s 22p 6)3s 23p 63d 10)4s 24p 6) ... etc.

Na Mg Al Si p

4s

3d

4p

ls 1s 2 ) 1s 2 )2s 1s 2 )2s 2 1s 2 )2s 2 2p 1s,)2s,2p> 1s 2 )2s 2 2p 3 1s,)2s,2p4 1s2 )2s 2 2p 5 1s2 )2s 2 2p 6)

Según la representación de esta tabla, el átomo más simple, H, tiene un solo electrón, que en la configuración de energía más baja del sistema, debe encontrarse en un estado ls. El siguiente átomo, He, con dos electrones, puede tener dos electrones ls con espins opuestos en la configuración de energía más baja (o estado fundamental o basal). Esta configuración se denota con ls 2 Puesto que sólo hay dos estados relacionados con el nivel n = 1, 1 = O, el siguiente átomo más complejo,

144 Mecánica cuántica. Generalidades Li, debe tener, de acuerdo con el principio de Pauli, la configuración de estado basal ls 2 )2s, con lo cual se indica que el tercer electrón pasa al siguiente estado energético más bajo, o sea, 2s. El cuarto elemento, Be, tiene dos electrones 2s más; pero puesto que sólo existen dos estados 2s, el principio de Pauli requiere que el quinto elemento, B, tenga un electrón en el nivel 2p, que es el más bajo en energía, excepción hecha de ls y 2s; así pues, B tiene la configuración de estado basal ls 2 )2s 2 2p. Existen seis estados 2p posibles que corresponden a los números cuánticos n = 2, l = 1, m = O ± 1 y m 9 = ± 1/2. Los cinco elementos siguientes, C, N, O, F y Ne tienen un electrón 2p adicional para llenar el nivel 2p. La capa 2p llena es esféricamente simétrica y muy estable, como sucede en la capa ls llena, y los elementos Ne y He, que tienen estas configuraciones, son gases inertes. Los elementos subsecuentes llenan, entonces, las capas 3s y 3p, como se indica en la tabla, y terminan con otro gas inerte, A, que tiene una capa 3p llena con 6 electrones. Los elementos que tienen arreglos similares de los electrones externos o de valencia en los grupos n = 2 y n = 3, poseen propiedades químicas similares. Cuando se llena el nivel 3p, los dos elementos siguientes agregan electrones en los estados 4s y no en los niveles 3d, como podría esperarse. Esto se debe simplemente, a que el estado 4s tiene una energía más baja que el estado 3d. Luego viene una serie de 8 ''elementos de transición" que tienen una capa interna 3d incompleta. Cuando este nivel 3d se llena por fin, se sigue llenando la capa 4p concluyendo con otro gas inerte, Kr. El resto de la tabla se puede elaborar siguiendo, por lo general los mismos lineamientos. En todos los casos, la estructura de la capa externa de elementos químicamente relacionados, tales como Li, Na, K, Rb, y Cs es idéntica. Por tanto, es evidente que la teoría cuántica explica satisfactoriamente no sólo la estructura de los niveles energéticos observados espectroscópicamente, en el caso de los átomos complejos, sino que también explica la disposición de los átomos en el sistema periódico y la regularidad con que se distribuyen en dicha tabla las propiedades químicas de los elementos.

EJERCICIOS l. Demuestre que el valor esperado de la energía es igual a la constante de separación é, para un sistema que tiene funciones de onda dependientes del tiempo, de la forma (4.8-8). Demuestre que el valor esperado del operador hamlltoniano, tomado sobre la función de onda independiente del tiempo es igual a é para este tipo de sistema. 2. Demuestre que si z 1 y z 2 son dos números complejos cualesquiera, entonces (z 1 z 2 )* = zjz~; demuestre que el conjugado complejo de una cantidad compleja expresado en forma polar feifJ (f. 8 real) es {*e-ifJ. 3. Para la partícula libre de la sección 4.9, la velocidad de fase, de acuerdo con (4.9-5) es w/k =f'k/2m =p/2m. Sin embargo, desde el punto de vista clásico, la velocidad de una partícula libre es p/m. Explique por qué discrepan en un factor de 2. 4. Verifique directamente que la función de onda (4.9-11) correspondiente a una partícula libre, satisface la ecuación de Schrodinger (4.7-3) cuando V= O. 5. Verifique la ecuación (4.9-18) expresando la función (4.9-17) como un integral de Fourier con la ayuda de (4.9-16). 6. Encuentre (x)n, {px)n, {pi>n para el nésimo estado propio del pozo de potencial infinitamente profundo de la sección 4.10, y demue~tre explícitamente que En= {p~)n/2m, para las partícula libre. 7. ¿Cuál es la razón de las amplitudes que tienen las funciones propias del continuo del pozo de potencial finito de la sección 4.11, en la región (-a <x a)? 8. De acuerdo con la definición (4.12-29), demuestre 4ue dHn(~/d~ = 2nHn-i (~). Nota: observe que dn(xf(x))/dxn =X dnffdxn + ndn-i {/dxn-i. 9. A partir de (4.12-29), corrobore que Hn+i(~=2~n(~)- 2nHn_¡(~). 10. De acuerdo con los re~ultados de los problemas 8 y 9, demuestre que las funciones Hn(~) satisfacen la ecuación de Hermite (4.12-16).

El espín electrónico

145

11. Encuentre el valor esperado de la energía potencial n para el nésimo estado propio de un oscilador armónico cuántico unidimensional: Nota: use las propiedades de ortogonalidad de las funciones de onda. 12. Determine el valor esperado de la energía cinética n correspondiente al nésimo estado propio de un oscilador armónico cuántico unidimensional y utilice el resultado del problema 11 para demostrar que (V)n +n = hvo
LECTURAS RECOMENDADAS D. Bohm, Quantum Mechanics, Prentice-Hall, Inc., Englewood Cliffs, N.J. (1951). E. Ikenberry, Quantum Mechanics for Mathematicians and Physicists, Oxford University Press, Nueva York (1962). R. B. Leighton, Principies of Modern Physics, McGraw-Hill Book Co., lnc., Nueva York (1959). E. Merzbacher, Quantum Mechanics, John Wiley & Sons, Inc., Nueva York (1961). L. Pauling y E. B. Wilson, Introduction to Quantum Mechanics, McGraw-Hill Book Co., lnc., Nueva York (1935). J. L. Powell y B. Craseman, Quantum Mechanics, Addison-Wesley Publishing Company, Inc., Reading, Mass. (1961). C. W. Sherwm, lntroduction to Quantum Mechanics, Holt, Rinehart and Winston, Inc., Nueva York (1959). J. C. Slater, Quantum Theory of Matter, McGraw-Hill Book Co., Inc., Nueva York (1951).

CAPITULO

5

Mecánica estadística. Generalidades 5.1

INTRODUCCION

El objetivo de la mecamca estadística es analizar el comportamiento de un gran conjunto de partículas o sistemas idénticos, en una forma estadística o probabilística, derivando los valores más probables de las propiedades del conjunto sin inquirir en detalle los valores de estas propiedades para una partícula dada en un momento determinado. Este estudio se limitará a un conjunto de sistemas idénticos que se supondrán independientes unos de otros, excepto que pueden actuar entre sí o con el medio ambiente externo, sólo a través de procesos instantáneos que conservan la energía y la cantidad de movimiento. Por ejemplo, estos sistemas podrían ser las partículas de un gas monoatómico ideal de partículas libres que pueden interactuar unas con otras o con el medio circundante, interviniendo en colisiones instantáneas, o bien podrían representar sistemas de otros tipos. Los campos de fuerza externos (eléctrico, magnético o gravitacional, etc.,) también pueden ejercer su influencia en estos sistemas. En tales circunstancias, se puede tratar a ::ada sistema de un modo independiente de los demás, y se puede describir el comportamiento de cualquier sistema de acuerdo con sus coordenadas en un espacio de fase sesquidimensional cuyas coordenadas son (x, y, z, Px, Py. Pz). Se supone que estas coordenadas son independientes y ortogonales, y la especificación completa del estado de movimiento de cualquier partícula perteneciente al conjunto se expresa asignando valores a estas seis coordenadas espaciales; entonces, su comportamiento subsecuente se puede describir, en principio, basándose en estos conocimientos. El postulado básico de la mecánica estadística es que la probabilidad a priori de que un sistema esté en cualquier estado cuántico dado, es la misma para todos los estados cuánticos del sistema. Esto significa, por ejemplo, que la probabilidad a priori de que una partícula libre se encuentre dentro de una región (Ax, Áy, &) alrededor de (x, y, z) es la misma para todos los valores de x, y, z, y la probabilidad de que su cantidad de movimiento esté comprendida dentro de una región (¡jpx, ¡jpy, ¡jpz) alrededor de (px,Py.Pz) es idéntica para todos los valores de (px, Py, Pz). Se debe subrayar el hecho de que este postulado se refiere sólo a las probabilidades a priori, es decir, a las probabilidades que prevalecen en ausencia de cualquier restricción dinámica. Las probabilidades a priori en cualquier conjunto de sistemas se modifica casi siempre mediante restricciones externas impuestas al sistema, tales como requisitos de que el número total y la energía total de todos los sistemas que pertenecen al conjunto se mantengan constantes. 147

148 Mecánico estadística. Generalidades Primero se tratarán las partículas pertenecientes al conjunto, como si fueran las clásicas "bolas de billar," considerando que se pueden distinguir unas de otras y suprimiendo que un número cualquiera de ellas puede encontrarse en un solo estado cuántico. Después de esto se investigará el efecto que tiene el principio de exclusión de Pauli y cuál es el efecto de la imposibilidad de identificación de las partículas elementales que se están estudiando. Se recurrirá con mucha frecuencia a los resultados del capítulo anterior e, incluso, en el caso del planteamiento estadístico de las partículas clásicas, se utilizará el marco cuántico de los niveles energéticos y los estados cuánticos, aunque no sea absolutamente necesario hacerlo, con el fin de conservar la misma consistencia y uniformidad.

5.2

LA FUNCION DE DISTRIBUCION Y LA DENSIDAD DE LOS ESTADOS

Para calcular las propiedades promedio de un conjunto de partículas, por lo general se necesita conocer la forma en que dichas partículas están distribuidas, en promedio, en lo que respecta a la energía. Si el número promedio de partículas del sistema que ocupa un solo estado cuántico de energía e se designa como f(e) y si se hace que g(e)de sea el número de estados cuánticos del sistema, cuya energía está dentro de un rango de alrededor de e, entonces, el número de partículas del sistema cuya energía está dentro del rango de alrededor de e está dado por N(e)de, en donde

N( e) de = f(e)g(e) de.

(5.2-1)

La cantidad f(e), como se definió antes, se denomina función de distribución del sistema, y depende de las probabilidades relacionadas con la distribución de las partículas del sistema entre los estados cuánticos disponibles. La cantidad g(e), que depende sólo de la forma en que los estados cuánticos mismos están situados en lo que respecta a la energía, se llama densidad de los estados. Si se conocen estas dos cantidades, el valor promedio de cualquier cantidad a que se puede expresar como una función de la energía total e, se puede evaluar como

f f ~f

rx(e)N(a) de

=

"---:o----

N(e) de

=

rx(e)f(e)g(e) de,

(5.2-2)

la integral de N(e)de tomada sobre todos los valores posibles de e da simplemente N, que es el número total de partículas del sistema. Si la cantidad a es una función de las coordenadas del sistema q¡( = x,y,z, para i = 1, 2, 3, respectivamente) y las cantidades de movimiento p¡( = Px• Py. Pz, en la misma forma) que no se puede expresar como una función exclusiva de la energía total e, entonces e se puede expresar como

La función de distribución y la densidad de los estados

149

una función de las coordenadas y las cantidades de movimiento, como la suma de las energías cinética y potencial, ¡¡ =

1 "L. p¡, -2 m¡

+ V(q¡),

(5.2-3)

y el valor promedio de ex evaluado como una integral sobre las coordenadas del espacio de fase como

JI (a.)=

a.(p¡.q¡}f(p¡,q¡) dp dq .

(5.2-4)

JJJ(p¡,q¡} dp dq En este caso, f(p¡, q¡) representa la función de distribución .f(E) en donde E se expresa en función de p¡ y q¡ por m~dio de (5.2-3), y las cantidades dp y dq representan los elementos de volumen en el espacio de cantidades de movimiento y en el espacio de coordenadas expresadas en cualquier forma (cartesianas, cilíndricas, esféricas, etc.) que pueda ser conveniente para la integración. La ecuación (5.2-4) no contiene ningún factor de densidad de estados g{p¡, q¡) debido a que, como se verá en breve, en sistemas del tipo que se está estudiando, la densidad de los estados cuánticos en el espacio de fase es constante y se cancelan en el numerador y el denominador de (5.2-4). Las expresiones (5.2-2) o (5.2-4) se mencionarán con frecuencia cuando se calculen los promedios. Puesto que el factor de densidad de estados g( E), según se define en relación con (5.2-1), depende sólo de la dtstribución de los estados cuánticos del sistema en cuanto a la energía, debe existir la posibilidad de calcular g{E) a partir de la solución de la ecuación de Schrodinger. Esto se puede hacer en relación con las partículas libres tal y como se definieron en la sección 5.1, suponiendo que el sistema está confinado en el interior de un recipiente rígido cuyas dimensiones son x 0 ,y 0 ,z 0 en las direcciones x-, y- y z-, respectivamente. En efecto, este recipiente es un pozo de potencial infinitamente profundo para las partículas que se encuentran en su interior, siendo el potencial igual a cero para cada partícula que se encuentra dentro del recipiente, a condición de que las interacciones de las partículas estén restringidas a colisiones instantáneas. En este caso, dentro del recipiente, la ecuación de Schrodinger se puede escribir de acuerdo con ( 4.8-5) como sigue (5.2-5) en donde (5.2-6) De acuerdo con los resultados dados en las secciones 4.10 y 4.11, se puede llegar a la conclusión de que 1/1 =O, fuera del recipiente. De acuerdo con (4.9-3), se puede esperar que una solución válida para (5.2-5) sería una onda plana de la forma (5.2-7) Se puede verificar con facilidad que, en efecto, esta solución satisface lo establecido en (5.2-5). En realidad, la ecuación (5.2-7) se puede obtener como una solución de (5.2-5) mediante la técnica de separación de variables que se usó con el

lSO Mecánict1 estadística. Generalidades átomo de hidrógeno, suponiendo inicialmente una solución de producto de la forma t/1 = X(x) Y(y) Z(z). Sin embargo, para que (5.2-7) sea una solución de (5.2-5), las cantidades kx, ky y kz de (5.2-7) se deben relacionar en tal forma que (5.2-8) y, en este caso, se puede considerar que estas cantidades se comportan como las componentes de un vector k que se conoce como vector de propagación. Si se estudia el carácter físico de la función de onda dependiente del tiempo que se relaciona con (5.2-7) por medio de (4.8-7), 'P(x,y,z,t)

= Aei(k·r-wr) (5.2-9)

(w = efh),

debe ser evidente que la dirección de k es la misma que aquella en la que avanza el frente de la onda. La explicación física real de esto quedará asignada como tarea para el lector. Utilizando los métodos desarrollados en el último capítulo, se puede demostrar que el valor esperado de la cantidad de movimiento vectorial p está dado por (p) = hk,

(5.2-10)

y que p (y, por tanto, k) es una constante del movimiento. Para las condiciones de frontera, se requerirá que la función de onda en cualquiera de las caras del recipiente sea igual a la de la cara opuesta. Estas condiciones de frontera periódicas o cíclicas se vieron con anterioridad en relación con las vibraciones de red (sección 3.3). En una geometría unidimensional, estas condiciones de frontera representan un sistema que equivale topológicamente a un anillo. En tres dimensiones, las condiciones periódicas de frontera dividen todo el espacio en regiones exactamente similares cuyas dimensiones son (x 0 , y 0 , z 0 ), siendo la función de onda la misma en cada una de ellas, y cualquiera de estas regiones se puede usar para representar el interior del pozo de potencial correspondiente al recipiente. Procediendo de esta manera y suponiendo que los bordes del recipiente se extienden a lo largo del eje x desde O hasta Xo, a lo largo de la dirección y, de O a y 0 y en la dirección z, de O a z 0 , las condiciones de frontera se convierten en tf¡(O,y,-z) = tf¡(x 0 ,y,z) t/l(x,O,z) = tf¡(x,y 0 ,z) tf¡(x,y,O)

(5.2-11)

= tf¡(x,y,z 0 ),

lo cual requiere que en (5.2-7) se tome (nx

= 0,± 1,±2, ···)

(ny = 0,± 1,±2, ···) (nz

= 0,± 1,±2. ··· ),

(5.2-12)

La función de distribución y la densidad de los estados

151

y luego, (5.2-7) se reduce a 1/l(x,y,z) = Ae

lni(nxx + nll'y xo Jlo

+ ~) zo •

(5.2-13)

De acuerdo con (5.2-2) y (5.2-6), esto significa que sólo es permisible un grupo discreto de valores de energía dados por (5.2-14)

De acuerdo con (5.2-10), los valores permisibles de (kx, ky, kz) se pueden expresar como los valores permisibles de (px,Py,Pz) en la forma

Py = hny/Yo

(5.2-15)

Si se graficaran todos los valores permisibles de la cantidad de movimiento, haciéndolos corresponder a todos los valores enteros posibles de (nx, ny, nz) en (5.2-15), como puntos en un espacio ortogonal de cantidad de movimiento cuyas coordenadas son (px, Py, Pz ), se obtendría una red ortogonal simple de los puntos,• que representan los valores permisibles de la cantidad de movimiento, en donde las dimensiones de la célula unitaria (h/x 0 , h/y 0 , h/z 0 ) corresponden a los cambios unitarios en (nx, ny, nz) en (5.2-15). El volumen del espacio de cantidad de movimiento correspondiente a un solo estado cuántico del sistema es, simplemente, el volumen de la celda unitaria (5.2-16)

en donde V es el volumen físico del recipiente. De acuerdo con esto (y con la gráfica de los puntos que representan las cantidades de movimiento permisibles), se observa que la densidad con la que están distribuidos los estados cuánticos permisibles en el espacio de cantidad de movimiento, es uniforme sobre todo el espacio, [lo cual se mencionó anteriormente en relación con las ecuaciones (5.7-4)]. En (5.2-16), no se tomó en cuenta el espín; para partículas con espín de l/2, como los electrones, existen dos estados permisibles de cantidad de movimiento por cada punto reticular dentro del espacio de cantidad de movimiento correspondientes a las dos orientaciones posibles de espín de la partícula. Si se toma esto t'n cuenta, (5.2-16) debe escribirse en la forma (5.2-17) Para valores grandes de x 0 ,y 0 y z 0 , tales como los que se relacionan con un recipiente de dimensiones macroscópicas, el volumen VP de (5.2-17) se hace muy pequeño y los estados de cantidad de movimiento (5.2-15) y los estados de energía (5.2-14) se concentran excesivamente en comparación con los intervalos de energía y cantidad de movimiento que se pueden apreciar macroscópicamente. Entonces, para un sistema de dimensiones razonables, estará justificado el considerar que los valores permisibles de energía y cantidad de movimiento están distribuidos t'n una forma substancialmente continua dentro del espacio de cantidad de movimiento.

152 Mecánica estadística. Generalidades Ahora se verá una superficie dentro del espacio de cantidad de movimiento (px, p , Pz), estando todos estos puntos a una energía constante e. De acuerdo con

(5.2-6), (5.2-8)__rj_5.2-10), la ecuación de esta superficie debe ser la de una esfera de radio p = ..j2me, o bien, P2 = Px2

+ Py2 + Pz2 = 2me.

(5.2-18)

Esta superficie aparece ilustrada en la figura 5.1. En esta misma figura se muestra una esfera similar cuya superficie representa todos los puntos de energía e + de. La capa esférica entre estas dos esferas representa la región del espacio de cantidad de movimiento correspondiente a las energías comprendidas en el rango de e a e +de. El volumen del espacio de cantidad de movimiento contenido dentro de. esta capa es dVP

= 4n:p 2 dp.

(5.2-19)

Sin embargo, de acuerdo con (5.2-18), p dp =m de,

(5.2-20)

dVP = 4n:p ·m de= 4n:mjlme de.

(5.2-21)

por lo cual,

El número de estados cuánticos que se pueden encontrar en este volumen del espacio de cantidad de movimiento se determina dividiendo este resultado entre el volumen de tal espacio, relacionado con un solo estado cuántico dado por (5.2-17). Por definición, el resultado g(e) de

8 fin:v

= "h 3

J-

(5.2-22)

m3 ' 2 e de,

es el factor de densidad de estados que se menciona en (5.2-1). Por supuesto, este resultado se refiere sólo a las partículas libres suje~as exclusivamente a interacciones tales como choques instantáneos. Para otros sistemas, sobre todo aquellos en los que

Cantidad de movimiento p, energía • Cantidad de movimiento p energía • + d•

+ dp,

P,

Figura 5.1.

Superficit>s esféricas correspondientes a energías constantes e y e +de graficadas en el c<pacio de cantidad de movimiento (px, Py, Pz) de una partícula.

La distribución Maxwe/1-Boltzmann

153

se produ..~.: L'!n3C..-iooes mutuas de largo alcance entre partículas, el factor de densidad de esudos sería mucho más complejo. Así también, el resultado (5.2-22) pertenece estrictamente hablando sólo a un recipiente de la forma de un sólido rectangular. No obstante, puesto que sólo en el resultado fmal aparece el volumen d~l recipiente, por simple intuición se deduce que se obtendría la misma densidad de ntados para un recipiente de volumen semejante, independientemente de su forma. Se puede demostrar que esto es verdad.

5.3

LA DISTRIBUCION MAXWELL-BOLTZMANN

Si no existen restricciones respecto a los valores de energía y cantidad de movimiento que una partícula del sistema pueda poseer, la probabilidad asociada con todos los estados cuánticos es la misma y el promedio del número de partículas por estado cuántico será independiente de la energía. Esto significa que la función de distribución fte) será constante. Esta simple situación no es muy importante desde el punto de vista físico, ya que un sistema que está térmicamente aislado del medio que lo rodea debe obedecer la restricción de que la suma de las energías de todas las partículas del sistema debe ser constante, y éste es precisamente el tipo de sistema que se estudiará aquí. En este caso que es más apegado a la realidad se reduce la proporción de partículas que ocupan estados de energía sumamente altos, y la función de distribución ya no es constante con respecto a la energía. Para determinar cuál es la función de distribución en estas condiciones, será necesario proceder en primer lugar de acuerdo con los lineamientos clásicos, imagi· nando que las partículas del sistema son objetos identificables tales como las bolas de billar numeradas. Todo esto se hará dentro del marco de los estados cuánticos y los niveles de energía, aunque, haciendo caso omiso del principio de exclusión de Pauli, se permitirá que un número de partículas ocupe un estado cuántico dado del s1stema. Se supondrá que se trata de un sistema aislado de N partículas distinguibles, .:on una energía total constante U que se puede distribuir entre n niveles de energía e1 , e2 , e2 , • • • e¡, • • • En. Desde el punto de vista estadístico, el conjunto tendrá la distribución de energía que corresponde a una distribución aleatoria de partículas entre los niveles, y en donde el número de cada nivel está dado por .V 1 ,N2 ,N3 , · ··N¡,···Nn. De todas las distribuciones fortuitas de N partículas ~ntre n niveles energéticos, algunas ocurrirán con una probabilidad relativamente alta desde un punto de vista puramente estadístico, y otras serán muy poco probables. Esta situación es análoga al hecho de lanzar simultáneamente dos monedas en las que la distribución (1 águila, 1 sol) es más probable que la distribución (2 águila, O sol) o bien, (O águila, 2 sol). La distribución que tiene la máxima probabilidad de ocurrir es la distribución de partículas entre niveles que se pueden producir dentro de un número máximo de formas estadísticamente independientes. En consecuencia, se supondrá que el estado de equilibrio del sistema corresponde íntimamente a esta distribución estadística de partículas entre niveles que tienen la máxima probabilidad en las condiciones del problema. El cálculo del número de maneras en que las partículas identificables se pueden distribuir entre los niveles energéticos de un sistema, equivale a la determinación del número de formas en que una cantidad de objetos numerados se puede distribuir entre un conjunto de recipientes también numerados. Así pues, es necesario estudiar el problema de determinar la cantidad de formas para distribuir N objetos identificables entre n recipientes, de tal manera que haya N 1 en el primero, N 2 en el segundo, • • • , N¡ en el iésimo, etc. Este número será proporcional a la probabilidad

154

Mecánica estadística. Generalidades

con la que pueda ocurrir una distribución en donde N 1 , N 2 , • • • , Nn objetos se encuentran dentro de los recipientes 1, 2, 3, • • • , n. En primer lugar, se supondrá que se cuenta sólo con dos recipientes en los que se pueden colocar los objetos, como se ilustra en la figura 5.2. En general, se tendrán N 1 objetos dentro del recipiente 1 y N 2 en el recipiente 2, con N1

+ N2 =

(5.3-1)

N = const.

Sea Q(N 1 , N 2 ) el número de formas estadísticamente independientes de llegar a la distribución (N 1 ,N2 ) de objetos en los recipientes (1, 2). Ahora, Q(O,N2 ) es evidentemente igual a 1, porque la única forma de lograr esta distribución es poner todos los N objetos dentro de la segunda caja, como se indica en la figura. De igual manera, Q(l, N 2 ) =N, ya que para alcanzar esta distribución se puede poner el objeto 1 dentro del primer recipiente y el resto en el segundo, el objeto 2 dentro del primer recipiente y el resto en el segundo, y así sucesivamente hasta N objetos. Existen N formas de seleccionar un objeto para colocarlo dentro del primer recipiente y, por tanto, N maneras de llegar a la distribución deseada. Si se tienen dos objetos dentro de la primera caja, entonces Q(2,N2 ) =N(N- 1)/2! . Este resultado se obtiene debido a que hay N formas de escoger el primer objeto que va al primer recipiente; pero sólo N- 1 maneras de escoger el segundo de los objetos restantes. Así también, las dos distribuciones en las que el objeto numerado a se escogió como el primero y el objeto numerado {J como el segundo para colocarlo dentro del primer recipiente, y en donde {J se escogió como el primero y a como el segundo, son en realidad idénticos, y los mismos dos objetos acaban por colocarse dentro de la primera caja; por tanto, el factor N(N- 1) se debe dividir entre dos. Para el caso en que se tienen tres objetos dentro de la primera caja, existen N formas de escoger el primero, N- 1 formas de escoger el segundo y N - 2 maneras de escoger el

Nz

Compartimiento Núm.

(j)

® ®---0---® Partículas

2

Q(O,N2 ) = 1 2

Q(I,N2 )=N

formas de escoger a N-1 formas de escoger (3 (pero las dos distril:iuciones que aparecen a la izquierda son la misma) N

Q( 2 N)=N(N-I) ' 2 21

formas de escoger a N-1 formas de escoger p N-2 formas de escoger 'Y (pero las 3! distril:iuciones ilustradas son la misma)

N

Figura 5.2.

Jo'ormas posibles de distribuir N partículas identificables entre dos recipientes.

La distribución Maxwell-Boltzmann

tercero, en tanto que hay 3!

1SS

formas de permutar entre sí los objetos enumerados

a, (3, y 'Y como si se les hubiera seleccionado en primero, segundo y tercer lugares, por lo que Q(3, N 2 ) = N(N- 2)/3! . Por supuesto, se puede confirmar con este procedimiento, entonces, recordando (5.3-I), se puede establecer que

Q(N¡,Nz)

=

N(N-1)(N-2)···(N-N 1 +1) N1!

N!

= N 1 !(N- N 1)!

N! N 1 !N 2 !

(5.3-2) Supóngase ahora que el segundo recipiente se divide en dos subcompartimientos que contienen v 1 y v2 objetos en donde, por supuesto,

(5.3-3) como se ilustra en la figura 5.3. El número de formas independientes que logra la distribución (v 1 , v 2 ) entre los subcompartimientos de la segunda caja es, de acuerdo con (5.3-3), (5.3-4) Sin embargo, ahora se podría considerar que el sistema tiene tres recipientes distintos y que el número total de maneras de acomodar los objetos, requerido para que haya N 1 en el primer recipiente, v 1 en el segundo y v2 en el tercero [que se denominará Q(N 1 ,v 1 ,v 2 )], será sencillamente el producto de Q(N1 ,N2 ) y Q(v 1 ,v 2 ), ya que para cada arreglo (N1 , N 2 ), habrá Q(v 1 , v 2 ) maneras de acomodar las par-

IN· Compartimiento : 1 Figura 5.3.

m

~

2

Subdivisión del segundo recipiente en dos subcompartimientos; de hecho, se puede considerar que el sistema así obtenido se ha dividido en tres recipientes diferentes.

tículas entre los subcompartimientos y existen Q(N 1 ,N2 ) maneras básicas de llegar a una distribución (N1 , N 2 ) para los dos recipientes originales. De donde, se encontrará que

(5.3-5) A continuación, el trabajo se limita a marcar de nuevo los tres recipientes como las cajas 1, 2 y 3, y denominar a los objetos dentro de cada una N 1 , N 2 y N3 en lugar de N 1 , V 1 y v 1 , en cuyo caso (5.3.-5) se puede expresar como sigue N! Q(N¡,Nz,N3) =N

1N 1N 1 1. 2. 3.

(5.3-6)

156

Mecónica estadística. Generalidades

Una vez más, se puede imaginar que el tercer compartimiento se subdivide como antes y, utilizando el mismo procedimiento se obtiene una expresión para el número de acomodos requeridos a fm de distribuir N objetos entre cuatro cajas en un forma tal que se obtenga una distribución (N 1 , N 2 , N 3 , N 4 ). Mediante la aplica· ción repetida de este procedimiento el resultado se puede extender indefinidamente por inducción hasta abarcar el caso en que se tengan n cajas. De acuerdo con (5.3-3) y (5.3-6), es evidente que se encontrará (5.3-7)

en donde el símbolo TI indica un producto ampliado, en la misma forma en que el bien conocido expresa una suma. La probabilidad real relacionada con una distrioución dada de N objetos entre n cajas, es el número de diferentes maneras de acomodar objetos en Q(N 1 , • • • Nn) cajas, requerido para obtener esta distribución particular, dividido entre el número total de maneras de acomodar N objetos en n cajas sin tener en cuenta la distribución resultante de objetos entre las cajas. Como se puede demostrar con facilidad, este último factor es nN. La probabilidad relacionada con una distribución dada es, entonces, Q(N 1 , • • • Nn)/nN. Sin embargo, se encontrará que es más conveniente manejar sólo las cantidades Q(N 1 , • • • Nn), que son proporcionales a las probabilidades reales, ya que sólo se tiene el interés de determinar los valores de N 1 , • • • Nn que le dan un máximo a la probabilidad y, si Q(N 1 , • • • Nn), es un máximo, también lo es la probabilidad asociada. Ahora se identificará el iésimo recipiente con el iésimo nivel energético del sistema, y el número de objetos N¡ de dicho recipiente con la cantidad de partículas pertenecientes a ese nivel. Sin embargo, se debe permitir un margen por si los niveles energéticos degeneran y se supondrá que hay g¡ estados cuánticos independientes asociados con el iésimo nivel energético, cada uno de los cuales tiene la misma probabilidad a priori de estar ocupado, de acuerdo con el postulado fundamental de la sección 5.1. Entonces, cada nivel de energía se debe considerar no como un solo recipiente, sino como un grupo de g¡ recipientes, según se ilustra en la figura 5.4. Para un nivel energético dado, por ejemplo, el iésimo que contiene N¡ partículas y g¡ estados cuánticos independientes, existen gf'i formas de acomodar las partículas en los estados o recipientes pertenecientes a tal nivel, porque existen g¡ opciones independientes respecto al lugar en que se puede colocar la primera partícula y para cada una de éstas, hay g¡ selecciones del sitio donde se puede colocar la segunda, y

¿

Degeneración

g;

=4

.:

r-·-'-le. •• 1 • r--1-

--1--

Nivel Población N¡ Figura 5.4.

1

4

2

6

.

~···

2 7

---

1

1 •1

• _L n

2

La subdivisión de los niveles energéticos en diferentes estados cuánticos de acuerdo con ~u dcgenerac.:ión. Dichos estados desempeñan el mismo papel que los recipientes del desarrollo e~tadístico, y cada uno tiene el mismo peso estadístico.

La distribución Maxwell-Boltzmann

157

así sucesivamente hasta N¡ factores. Cada uno de estos arreglos constituye una forma estadísticamente, independiente de distribuir partículas entre los estados cuánticos del sistema, ya que estos estados cuánticos son de igual probabilidad, y no así los niveles energéticos. Si el primer nivel de energía e 1 , fuera el único nivel degenerado, se tendrían i( 1 maneras independientes de establecer una distribución específica de partículas entre los niveles energéticos, como se indica en (5.3-7), ya que existen muchas maneras de permutar las partículas entre los distintos estados degenerados pertenecientes al primer nivel, y por cada uno de éstos queda todavía el mismo número de maneras de asignar las partículas a los otros niveles del sistema, de tal modo que se obtenga la distribución (N1 , N 2 , • • • Nn). Si además el segundo nivel estuviera degenerado, se tendrían posibilidades por cada una que existió antes, siendo ahora el número total de formas independientes en que se logra una distribución dada de las partículas entre los niveles, ¡{ 1 veces la que se establece en ( 5 .3-7). Es obvio que cuando se incluye la degeneración de todos los niveles, el resultado (5.3-7) se deberá multiplicar por 1{ 1 21:3 • • • tf:n, lo cual da

112

112

11

º( N¡,N2,

... Nn ) = - n - N!

nn g¡N,

TIN¡!i=l

(5.3-8)

i= 1

cuando se incluye la degeneración. Ahora se supondrá que la distribución real (N 1 , N 2 , • • • N n) de partículas entre los estados energéticos que se observa en equilibrio, es esencialmente la que se suele obtener en el número máximo de formas estadísticamente independientes, en otras palabras, la distribución para la que la cantidad Q de (5.3-8) es un máximo. Entonces, Q debe maximizarse con respecto a los parámetros N 1 , N 2 , • • • Nn, teniendo en cuenta la~ restricciones n

L1 N¡ = N = const.

(5.3-9)

i=

y n

L e¡N¡ = U = const.

(5.3-10)

i= 1

Esta maxnmzacwn se logra con mayor facilidad utilizando la técnica matemá· tica denominada método de los multiplicadores de Lagrange y se hará un breve paréntesis para describir este tema. Supóngase que se da una función f(x 1 , x 2 , • • • x n) de n variables y hay que determinar los valores de x 1 , x 2 , • • • Xn que maximizan f, a condición de que alguna otra constante dada
df + (/. d

=o

(5.3-11)

sea cual fuere el valor que el multiplicador arbitrario indeterminado a pueda tener. obstante, (5.3-11) se puede expresar como

~o

158 Mecánica estadística. Generalidades

De acuerdo con esta ecuación, la condición ( 5.3-11) se satisface con toda seguridad si para cada i



o
OX¡

OX¡

(5.3-13)

{i = 1,2, ·· · n),

-+IX-=Ü

y como además se dio la información inicial de que

(5.3-14)

las ecuaciones {5.3-13) y (5.3-14), tomadas juntas, representan un grupo de n + 1 ecuaciones simultáneas que se pueden resolver para las n cantidades x 1 ,x 2 , • • • Xn que maximizan (o minimizan) a f y [para el multiplicador indeterminado] a que se introdujo en (5.3-11). Si existen dos funciones auxiliares cf>(x 1 , x 2 , • • • Xn) y ¡J¡(x 1 , x 2 , • • • Xn) que se deben mantener constantes mientras se maximiza la función f, entonces se introducen dos multiplicadores arbitrarios a y {3, y es necesario que

df + IX d
que lleva, en .la misma forma, a un conjunto de n



o
oi/J

OX¡

OX¡

OX¡

+ 2 ecuaciones

(i

-+IX-+/3-=Ü

(5.3-15)

=O,

= 1,2, ·· · n)

(5.3-16) (5.3-17)

¡J¡(x 1 ,x 2 ,

•••

x.)

=

1/1 0

(5.3-18)

= const.

paras las n + 2 incógnitas x 1 , x 2 , • • • x n, a y (3. A continuación se procederá a aplicar este método con el fin ce encontrar la distribución N 1 , N 2 , • • • Nn para la que (5.3-8) es un máximo. Para facilitar las operaciones matemáticas lo que en realidad se maximizará es In Q y no Q propiamente dicha; pero puesto que el logaritmo es una función monotónica de un solo valor de todas las variables comprendidas, cuando In Q es un máximo, también lo es Q. Si se toma el logaritmo de los dos lados de (5.3-8), se tiene que In Q(N 1 ,N 2 , ···N.)= In N!+

n

n

i= 1

i= 1

L N¡ In g¡- L In N;!.

(5.3-19)

Se supondrá que este sistema es tan grande que para cada nivel t:¡! se puede aproximar, utilizando la aproximación de Stirling según la cual, para x ~ 1, lnx!:::;;-xlnx-x.

(5.3-20)

Cuando se usa esta aproximación, {5.3-19) se convierte en In Q

=

In N!

+ L N¡ In g¡ - L N; In N¡ + L N;, i

i

i

(5.3-21)

La distribución Moxwell-Boltz1111lnn

159

que se debe maximizar bajo las restricciones

L N¡= N

(5.3-22)

L¡ e1N 1 =U.

(5.3-23)


¡

I/J(N¡,N2, ··· Nn) =

De acuerdo con (5.3-16), esto requiere que

o(ln Q)

o
oi/J

iJNi

oNi

oNi

a [ LN 1 lng 1 -

- - +1X-+{J-=-

oNi

1

]

¿N1 lnN1 + LN1 1

1

(j = 1,2, ··· n). (5.3-24) Al desarrollar las derivadas de {5.3-24), se observa que los únicos términos de las sumas cuyas derivadas con respecto a N¡ no sean cero son aquellos para los cuales i = j; por tanto, ( 5.3-24)se puede reducir a

(j = 1,2, ··· n).

(5.3-25)

Resolviendo para In (N¡/g¡) y desarrollando los exponenciales, esta expresión se puede escribir en la forma (5.3-26)

La ecuación ("5.3-26) proporciona el número promedio de partículas por estado cuántico del sistema y, por ende, representa por definición la función de distribución de energía f(e). Esta función de distribución particular de energía, que se obtuvo como {5.3-26) de acuerdo con la suposición clásica de partículas identificables y sin utilizar el principio de exclusión de Pauli, se conoce como función de distribución de Maxwe/1-Boltzmann. Conviene explicar la forma en que las dos constantes a y 13 se relacionan con las propiedades físicas del sistema. En primer lugar, a la constante 13 se le asignará el valor

p = -1/kT,

(5.3-27)

en donde T es la temperatura absoluta del sistema y k es una constante denominada constante de Boltzmann, y se considerará que esta ecuación junto con {5.3-26) definen lo que se entiende por temperatura. A su debido tiempo se verá que esta definición conduce a todas las bien conocidas características de temperatura que se asocian con un gas ideal y, entonces se podrá ver claramente que, antes de definir la temperatura, ya se podían identificar las propiedades de un gas ideal a partir de (5.3-26). Después se podría proceder a la identificación de p con el valor dado arriba, basándose en una comparación de los resultados así obtenidos y la ecuación termodinámica ya conocida del estado de un gas ideal (a partir de la cual se define más comúnmente la temperatura). Se demostrará que el valor de k se puede relacionar con la constante medida del gas ideal R y el número de Avogadro.

160 Mecánica estadística.. Generalidades

Si se utiliza el valor de (J dado en (5.3-27), la expresión (5.3-26) ahora se puede escribir como N.J = gJ.e"e-• 1/kT.

(5.3-28)

Luego, el valor de la constante a se puede expresar de acuerdo con el número total de partículas N ya que, de acuerdo con (5.3-9) y (5.3-28), N=

L N¡= e" L g¡e-•JfkT, j

(5.3-29)

j

por lo cual

e"=

N

L g¡e

e1tkT•

(5.3-30)

j

y

N = g .e"e-•JtkT = 1

J

Ng .e-•¡tkT J • •1¡kr

L g¡e

(5.3-31)

j

Si los niveles energéticos del sistema están muy próximos unos de otros, como sucede con los niveles del gas de partículas libres que se vio en la sección anterior, la cantidad g¡ de (5.3-28) se puede considerar como g(e)de y la cantidad N¡ de la ecuación se considerará como N(e)de, de acuerdo con lo expuesto en relación con la ecuación (5.2-1). El número de partículas dentro de un rango energético de alrededor de e dentro de este límite, estará dado, de acuerdo con (5.3-28), por N(e) de= e"e-•fkTg(e) de= f(e)g(e) de.

(5.3-32)

Para un gas ideal de partículas libres, el factor de densidad de estados g(e) está dado por (5.2-22). Obsérvese que la forma de (5.3-32) es la misma que la de (5.2-1), siendo !(e)= e"e-efkT. Una vez más, como se vio en relación con (3.3-31), se puede evaluar la constante a teniendo en cuenta la condición de que el número total de partículas dentro del sistema será una constante N, por lo cual N

=

f N(e) de = e" f g(e)e-•fkT de,

(5.3-33)

y

-f

N

e"-~----

(5.3-34)

g(e)e-•fkT de'

en donde las integrales se toman sobre todas las energías disponibles para las partículas del sistema. Se debe observar que la cantidad Q de (5.3-8) está íntimamente relacionada con la entropía termodinámica del sistema. En equilibrio, el estado del sistema es tal que Q. el número de formas estadísticamente independientes de distribuir las par-

La estadístiCil de Maxwell-Boltzmann para un gas ideal

161

f(•l

7j

ura S.S.

Representación esquemática de la función de distribución de energía de MaxwellBoltzmann para tres temperaturas distintas.

ulas entre los estados cuánticos, es un maxtmo como lo es la entropía del sisna Por ahora no se entrará en detalles; pero se puede demostrar 1 que la relación stente entre estas dos cantidades es S-= k In Q,

(5.3-35)

donde S es la entropía.

LA ESTADISTICA DE MAXWELL-BOLTZMANN PARA UN GAS IDEAL A continuación se analizarán las propiedades de un gas ideal de partículas es del tipo que se estudió en la sección 4.2. Para este sistema, el factor de sidad de estado g(€) d€ está dado por (5.2-22), debido a lo cual, de acuerdo con :-34), "'-

N

e - 8j2 ¡¡; V m 3!2 h3

f"" Jf.e-c!kT de

(5.4-1)

o

La integración se toma entre los límites cero e infinito, ya que la energía de partículas es totalmente cinética y, por ende, positiva. La integral de (5.4-l) se de expresar en una forma más sencilla mediante la substitución

x = efkT,

(5.4-2)

1 J. E. Mayer y M. Goppert-Maycr, Statistical Mechanics, John Wiley & Sons, Nueva York !.'1), capítulo 4.

162 Mecánica estadística. Generalidades

por lo cual, (5.4-1) se convierte en (5.4-3)

La integral se puede expresar ahora como una función define como

r-, 2

ya que f(n) se

(5.4-4)

siendo entonces la integral de (5.4-3) igual a f(3/2), que, a su vez, es igual a Si se inserta este valor en (5.4-3), se tiene que N ( h2 e"= 2V 2mnkT

)3/2 '

..J1i72. (5.4-5)

que permite escribir la función de la distribución de Maxwell-Boltzmann para un gas ideal como (5.4-6) Nótese que el valor de e" dado por (5.4-5), es dependiente de la temperatura. También conviene destacar quue este valor de e" pertenece sólo a la función de densidad de estados de partículas libres (5.2-22) y que para sistemas que tienen otras funciones de densidad de estado relacionadas con ellas, el valor de e" será diferente del que se da en (5.4-5). En la f~ura 5.5 se muestra una gráfica de la distribución de Boltzmann (5.4-6) para varias temperaturas. De acuerdo con (5.4-6) y (5.2-22), es obvio que la distribución real de la densidad de partículas con respecto a la energía está dada por

N(e) de =f(e)g(e) de=

2rrN r;,.e-•tkT de ( rrk T)312 \/ .

(5.4-7)

La energía interna total y el calor específico del gas se puede obtener fácilmente a partir de estos resultados. Puesto que la energía de las partículas en el rango de alrededor de e es eN( e) de, la energía interna total del gas es U= E'"eN(e) de,

(5.4-8)

o bien, utilizando (5.4-7), (5.4-9)

2 Véa~c.

pm <'Íl"mplo, I. S. y 1·~ S. Sokolnikoff, Hif{her Mathematics for Engineers and

1'/n•sicil'l.\, Md;raw-llill Hook Co., lnc., Nueva York (1941), página~. 273-276.

La estadística de Maxweii-Boltzmann para un gas ideal

163

Esta integral se puede evaluar en términos de las funciones r-, substituyendo (5.4-2). Al desarrollar la integral de este modo, y observando que r(5/2) = (3/2)r(3/2) = 3 .Jrr/4, se encuentra (5.4-10)

U =tNkT,

por lo cual, la energía interna promedio por partícula, U/N, es 3/2kT que es un resultado importante y muy conocido. La capacidad calorífica del gas a volumen constante es la razón de aumento de la energía interna con respecto a la temperatura, por lo cual, de acuerdo con (5.4-10),

e (au) ar

=1Nk

=

V

V

,

(5.4-11)

independiente de la temperatura. El calor específico Cv es simplemente la capacidad calorífica por unidad de volumen. El objetivo final es derivar la ecuación de estado para un gas de Boltzmann ideal a partir de las propiedades dinámicas de la partícula y la función de distribución. N:> obstante, antes de llegar a esto, es necesario convertir las distribuciones de energía (5.4-6) y (5.4-7), en distribuciones de velocidad apropiadas e investigar brevemente cómo se pueden usar estas funciones de distribución de velocidad. En la tabla 5.1 se proporciona el valor de algunas integrales definidas que se utilizan muy a menudo cuando se trabaja con las distribuciones de velocidad de Boltzmann. En un gas de partículas libres que no poseen ningún grado interno de libertad, toda la energía se basa en la energía cinética de las partículas. Esto se puede relacionar con la velocidad mediante la expresión (5.4-12) de donde

de= mv dv,

(5-4.13)

y la distribución de energía ( 5.4-7), se puede escribir directamente como una distribución de velocidad de la forma m

N(v) dv = 47tN ( 21tkT

)3/2v2e-mv>f2kT dv.

(5.4-14)

Esta función expresa el número de partículas el sistema cuvas velocidades quedan dentro de un rango dv alrededor de v, o el número de partículas que quedan dentro de una capa esférica cuyo espesor es dv y el radio es v, dentro del espacio de velocidad. Suponga que ahora se desea conocer cuántas partículas del sistema tienen velocidades tales que la componente x de la velocidad se encuentre dentro de un rango dvx alrededor Vx, la componente y está en el rango dvy alrededor de vy y la componente z está dentro de un rango derivada de Vz alrededor de Vz, o sea el número de partículas que quedan dentro de un elemento rectangular de volumen (dvxdvydvz) en el espacio de velocidad centrado alrededor del valor (vx, vy, Vz). Este

164 MecániCtJ estadístiCtJ. Generalidades TABLA 5.1. Integrales Maxwell-Boltzmann*

=-

4

kT m =

~; e~Tr2

=

~e~Tr

= 3~; e~Tr 2 =

e~Tr

=--

32

256 =-64

*La segunda columna de la tabla da el valor de la integral definida que aparece en la primera columna. La tercera columna indica el valor ~ la integral definida cuando a se hace igual a m/2kT, como casi siempre sucede cuando se trabaja con distribuciones de velocidad de Boltzmann. La cuarta columna expresa el resultado que aparece en la tercera columna como un múltiplo de 12 velocidad térmica media e, en donde

e= v8kT/Trm.

número se denominará N(vx, Vy, Vz)dvx dvy dvz. Ahora se procederá con más cuidado, principiando con (5.4-6) que, de acuerdo con (5.4-12), se puede escribir como !( V

N (

h2

V V)=- - - -

'"' '' z

2V 2nmkT

)3/2

e-m(v 2 x+v 2 ~+v 2 ,)/2kT

(5.4-15)

Entonces, como lo requiere (5.2-1), (5.4-16)

en donde g(vx, vy, ~·.)dvx dvy dvz es el número de estados cuánticos dentro del elemento de espacio de velocidad dvxdvvdvz. De acuerdo con (5.2-17) el número de

La estadística de Maxwell-Boltzmann para un gas ideal

165

estados dentro de un elemento de volumen dpx dpy dpz del espacio de cantidad de movimiento es (2V/h3) (dpxdPydPz), por lo cual, (5.4-17) Puesto que la densidad de estados en el espacio de cantidad de movimiento, es constante, también lo es la densidad de estados en el espacio de velocidad. Si se substituyen (5.4-15) y (5.4-17) en (5.4-16) y simplifica el resultado, se obtiene N(v

V V) x• Y' z

)3/2

m dv dv dv =N ( - x y z 21tkT

e-mlu'"+u'y+u'.)/lkT

dv dv dv x

Y



(5.4-18) Una tercera función de distribución de velocidad N(vx)dvx, que representa el número de partículas cuya componente x de velocidad queda dentro del rango dvx alrededor de Vx, sean cuales fueren los valores de las componentes y- y z- de velocidad para dichas partículas, está íntimamente relacionada con la función de distribución (5.4-18). La función de distribución N(vx)dvx se puede calcular a partir de (5.4-18) integrando sobre todos los valores posibles de vy y Vz, siendo el resul· tado

(5.4-19) Los valores de las integrales definidas requeridas al integrar (5.4-18), se tomaron de la tabla 5.1. En la figura 5.6 se ilustra una gráfica de la distribución N(v) y N(vx) como funciones de la coordenada de velocidad aprÓpiada. Si se conocen estas tres funciones de distribución de velocidad, es muy fácil evaluar los promedios sobre las distribuciones de velocidad. Por ejemplo, la velocidad

(o) Figura 5.6.

( b)

(a) Representación esquemática de la distribución de Maxwell-Boltzmann de las velocidades de partículas, N(v) a tres temperaturas distintas. (b) La distribución correspondiente de las componentes x de la velocidad, N(vx).

166 Mecánica estadística. Generalidodes

térmica promedio e para una partícula en una distribución de Boltzmann, se obtiene a partir de (5.4-14) escribiendo

ra) J, vN(v)dv 1 312 a) (v) = o =-. 4nN (~-) f v3e-mv2f2kT dv Soa) N(v)dv N 2nkT Jo (5.4-20)

= J8kT/nm,

en donde la integral se evaluó con la ayuda de la tabla 5.1. Ahora ya se puede pasar al estudio de la ecuación de estado de un gas ideal. Supóngase que las partículas chocan contra una área unitaria de la pared de un recipiente lleno con dicho gas, como se ilustra en la figura 5.7. Si la pared es un plano orientado en sentido normal al eje x, las componentes de la cantidad de movimiento Py y Pz de las partículas que chocan contra la pared, se conservan, si las colisiones de las partículas con las paredes son elásticas, lo cual se supondrá, es el caso de que se trata. En cada colisión, la componente de velocidad Vx dirigida hacia la pared, cambia a - Vx, alejándose de la pared. La transferencia de cantidad de movimiento de la partícula a la pared, por colisión, es entonces 2mvx. La trans-

r----

las partículas de 1 velocidades Vx dentro l de este volumen chocarán-,-_ contra la pared durante 1 el período dt 1

Unidad de área

1

1 1 1

L____ _

-v.dt

Pared de recipiente

-x Figura S. 7.

Colisión elástica de una partícula contra la pared de un recipiente rígido, siendo Vx la componente x de la velocidad de dicha partícula.

ferencia de cantidad de movimiento a la pared en el intervalo de tiempo dt es esta cantidad por el número de partículas que chocan con la pared durante este período; para partículas cuya componente x de velocidad es Vx, se trata sencillamente del número de tales partículas dentro de un volumen que se extiende a una distanciad= vxdt detrás de la pared, o el número por unidad de volumen por vxdt, de donde, vxdt • N(vxXJvxfV. La transferencia de cantidad de movimiento en el tiempo dt para partículas cuya velocidades quedan dentro del rango dvx alrededor de Vx, entonces, es

La estadística de MaxweU-Boltzmann para un gas ideal

167

o bien, (5.4-21) La razón total de transferencia de cantidad de movimiento a las paredes, mediante las colisiones en que intervienen partículas con todos los valores posibles de vx, se puede obtener integrando sobre vx, lo cual da, con ayuda de (5.4-19) y la tabla 5.1,

dpx2m NJrn foo V 2 e -mv2xf2kT dV--NkT ----. dt

V

2nkT

0

x

x

V

(5.4-22)

Sin embargo, de acuerdo con la ley de Newton, el cambio en el tiempo de la cantidad de movimiento por una unidad de área de la pared del recipiente es igual a la fuerza ejercida sobre una unidad de área de la pared que, por definición, es la presión P. En consecuencia, la ecuación (5.4-22) se reduce a PV = NkT,

(5.4-23)

que es la ecuación de estado para un gas de Boltzmann de partículas independientes. La ecuación anterior tiene la misma forma que la ley del gas ideal ya conocida, aunque ésta se suele escribir PV = nRT,

(5.4-24)

en donde n es el número de moles de gas en el sistema y R es una "constante molar de gas" determinada en forma experimental, que es la misma para todos los gases "ideales". Si el sistema tiene n moles de gas, el número de partículas estará dado por N= nNA, en donde NA es el número de Avogadro igual a 6.026 X 10 23 moléculas por mol. En estas condiciones, (5.3-23) toma la forma PV = nNAkT,

(5.4-25)

por lo cual, comparando (5.4-24) con (5.4-25), es obvio que la constante de Boltzmann k debe estar dada por (5.4-26) de donde, la constante de Boltzmann es la constante de gas por partícula del sistema. Su valor se puede derivar de NA y R y es igual a 1.380 x lQ-16 ergs/°K, o bien, 8.615 x 1Q- 5 eV¡oK. Ahora se ve con claridad que el valor de la constante {3 en la función de distribución que se supuso en (5.3-27), se escogió correctamente. Si se hubieran desarrollado los cálculos hasta este punto sin suponer ningún valor para {3, se habría llegado a la ecuación (5.4-23), PV = -N/{3,

(5.4-27)

168 Mecánictl estadístictl. Generalidades y, para que esos resultados concuerden con la ley de los gases (5.4-24) establecidos experimentalmente, habría sido obligatorio escoger -N/P

N

= nRT =NA RT,

o bien, (5.4-28)

.S

ESTADISTICA DE FERMI-DIRAC

En el desarrollo de la función de distribución de Maxwell-Boltzmann, se considera que las partículas pueden distinguirse; pero en la práctica es imposible distinguir un electrón de cualquier otra partícula elemental. Es más, se admitió que un número cualquiera de partículas ocupara el rniemo estado cuántico del sistema, a pesar de que muchas de ellas, sobre todo los electrones, obedecen al principio de exclusión de Pauli, que no permite que un estado cuántico acepte a más de una partícula. Si estas condiciones adicionales se imponen al sistema, los cálculos de la sección 5.4 se deben modificar, dando como resultado otra función de distribución que se conoce como función de distribución de Fermi-Dirac. Esta distribución tiene una importancia enorme, ya que describe la conducta estadística de los electrones libres en los metales y los semiconductores; además, muchas propiedades eléctricas y térmicas de los sólidos que no se pueden comprender en absoluto a la luz de lo establecido con las estadísticas clásicas, se deducen como una consecuencia directa de la estadística de Fermi-Dirac. Si las partículas del sistema no se pueden distinguir, tampoco se pueden identificar numéricamente, como se supuso cuando se analizaron las diversas posibilidades ilustradas en la figura 5.2. En realidad, todas las diferentes distribuciones presentadas en cada hilera de la figura 5.2 que dan Q(N1 ,N2 ) para cualquier valor particular de N 1 , serían iguales si se eliminaran los números que identifican las partículas, en cuyo caso el factor (5.3-7) se reduce a la unidad. Sin embargo, en el iésimo nivel energético se pueden permutar las N; partículas entre los g; estados cuánticos pertenecientes a ese nivel, y se puede hacerlo de muchas maneras cada una de las cuales constituye una forma estadísticamente independiente de lograr un arreglo en el que N; partículas estén en el iésimo nivel energético del sistema, como se ilustra en la figura 5.8. El producto de los números posibles de permutaciones de partículas entre los estados cuánticos sobre todos los niveles energéticos del sistema, da entonces el número de formas independientes de efectuar una distribución dada de partículas entre los niveles de energía.

~f;~:~:!Y~:el 1·1·1·11·1·11 Estado Núm. Figura 5.8.

1 2

3 4 5

s

7

1·1 9 ,.

Una posible distribución de partículas entre los estados cuánticos del iésimo nivel de energía de un sistema en el que se aplica el principio de exclusión de Pauli.

Estadística de Fermi-Dirac

169

En el caso de Fermi-Dirac, en el que se supone que se aplica el pnncipio de exclusión de Pauli, se permite que haya, como máximo, una partícula por estado cuántico. En relación con la figura 5.8, que describe el iésimo nivel de energía del sistema, existen g¡ formas de seleccionar el punto en el que !>e debe insertar la primera partícula, g¡ - 1 formas de escoger en donde se inserta la segunda, ya que la segunda no puede ocupar el mismo estado cuántico que la primera, g¡ - 2 formas de escoger en donde insertar la tercera, y así sucesivamente. El número total de maneras de acomodar N¡ partículas en el iésimo nivel obtenido sobre esta base, es g.l

g1(g 1 - l)(g 1 - 2) ... (g 1 - N 1 + 1) = ( . -·~·)' g,

(5.5-1)

1.

No obstante, las partículas no se pueden distinguir entre sí y por tanto, en un arreglo dado de partículas las N¡! formas de permutadas unas con otras y entre estados, no se consideran como permutaciones diferentes. Fl número real de formas independientes de lograr una distribución de N¡ partículas en el iésimo nivel, se obtiene dividiendo (5.5-1) entre N¡! , lo cual da

(5.5-2)

N 1!(g1 - N 1)!

El número total de formas independientes de lograr una distribución de (N 1 , N 2 , • • • Nn) partículas indistinguibles entre n niveles energéticos, en donde no se tiene más de una por estado cuántico, es sólo el producto de los factores individuales de la forma (5.5-2) sobre todos los niveles, es decir,

(5.5-3) Ahora se procederá a maxlffiJZar el logaritmo de esta cantidad con respecto a las variables N 1 , N 2 , • • • Nn por el método de los multiplicadores lagrangeanos utilizados en la sección 5.3. De acuerdo con (5.5-3), se tiene que

In Q1 =

L In g1!- L In N1! - L ln(g1 i

i

N1)!,

i

(5.5-4)

que, utilizando la aproximación de Stirling (5.3-20) se puede describir

In Q1 =

L [g

1

In g1 - N 1 In N 1 - (g 1 - N 1) In(g 1 - N1)].

(5.5-5)

1

Nuevamente, se requiere que el número total de partículas del sistema y su energía total se mantengan constantes, lo que significa que las ecuaciones (5.3-22) y l5.3-23) deben aplicarse también en este caso, de donde, se puede escribir, al igual que antes

(j = 1, 2, ... n),

(5.5-6)

170

Mecánica estadística. Generalidades

en donde cp y 1/1 están dados por (5.3-22) y (5.3-23). Al substituir (5.5-5), (5.3-22) y (5.3-23) en esta ecuación, se obtiene

- a~J ~ N

1 In

N1 +

~ (g

1-

N 1) ln(g 1 - N 1)] +oc

a~i (~ N

1)

+

pa~i

(t e N 1

1)

=O.

(5.5-7)

Al desarrollar las derivadas de la sección 5.3, se encontró que (5.5-8)

o bien, reacomodando, haciendo las exponenciales, y resolviendo para N¡/g¡ =!(e¡),

f(e.) = N ·fg · = 1

1

1

1 11

1 + e " "1



(5.5-9)

Esta es la función de distribución de Fermi-Dirac. Al igual que en la sección 5.4, se considerará que el valor de (3 es

p=

(5.5-10)

-1/kT,

y más adelante se explicará el porqué de este paso. Lo más aceptado es expresar a como (X=

(5.5-11)

8¡/kT,

en donde e¡ es un parámetro con las dimensiones de la energía que se denomina energía de Fermi o bien, nivel de Fermi del sistema. Por tanto, la ecuación (5.5-9) se convierte en N·= J

gi

1 + e<•J

(5.5-12)

tt)fkT '

o bien, si se supone que los niveles se juntan formando un continuo, de modo que g¡(e¡)-+ g(e)de, entonces,

N(e)de

g(e)de

= g(e)f(e) de = 1 + e<•

•tlikT.

(5.5-13)

Para un gas de partículas independientes tales como electrones libres, g(e)de se representa mediante (5.2-22), al igual que un gas de Maxwell-Boltzmann. La energía de Fermi e¡ es, en general, una función de la temperatura cuya forma y dependencia de temperatura depende primordialmente de la densidad de la función de estados del sistema, al igual que en el caso del parámetro correspondiente e" de la distribución Maxwell-Boltzmann. Su valor se determina mediante la condición (5.3-22) o bien si se trata de un continuo de niveles, por medio de

N

= const.

=

f

g(e)de 1 + e<• •tlfkT =

f

g(e)f(e)de.

(5.5-14)

Estadístico de Fermi-Dirac

171

La integral se toma sobre todas las energías disponibles para las partículas del sistema. Para un gas de Fermi de partículas independientes, g(e) está dada por (5.2-22) y e¡ se determina mediante

N= B.j21tVm312

h3

roo

Jede

Jo 1 + e<•

e¡)/kT.

(5.5-15)

Desgraciadamente, esta integral no se puede evaluar en una forma analítica, de modo que e¡ no se pueda determinar como una función simple de la temperatura. Sin embargo, en un gas bidimensional de partículas libres, se puede demostrar, mediante los métodos usados para derivar (5.2-22), la función de densidad de estados es

g(e)de =

41tmA

""""'h2 de,

(5.5-16)

e independiente de la energía (ejercico 3, capítulo 5). En esta fórmula, A representa el área del "recipiente" bidimensional. Para este sistema, (5.5-14) se convierte en

roo de -¡¡r- Jo i + e<•-•¡)/kT•

41tmA N=

(5.5-17)

que se puede evaluar en forma cerrada, haciendo que uno resuelva para e¡ y se obtiene e1(T)

= kT ln(e•t
(5.5-18)

en donde

Nh 2 e¡(0)=-41tmA

(5.5-19)

es el valor que ej(1) toma conforme T tiende a cero, como está dado por (5.5-18). Los detalles del cálculo de este resultado son muy instructivos y quedan asignados como ejercicio para el lector. La variación de la energía de Fermi del gas bidimensional de partículas independientes se ilustra en la figura 5.9. Se notará en este caso, que la energía de Fermi es una función monotónica decreciente de la temperatura. La energía de Fermi para el gas de Fermi tridimensional, con la función de densidad de estados (5.2-22), presentará el mismo comportamiento general, excepto que en este caso, la variación de la energía de Fermi con respecto a la temperatura es lineal cuando los valores de ésta se mantienen razonablemente bajos, en tanto que para el ejemplo bidimensional, la variación es mucho más compleja a temperaturas bajas. Para muchos sistemas, incluyendo estos dos, la variación del nivel de Fermi con respecto a la temperatura es p~queña sobre el rango de temperaturas físicamente posibles; en la figura 5.9, la temperatura a la que e¡= O sería del orden de 75000°K para un gas de electrones con la densidad de electrones libres correspondiente a la del cobre metálico. Por esta razón, en muchas aplicaciones la dependencia de temperatura de la energía de Ferrni se puede desechar o aproximar mediante una función lineal u otra apropiada de la temperatura. La función de distribución de Fermi propiamente dicha,

1 /(e) = 1 + e<•-•,>tkT '

(5.5-20)

172 Mecánica estadística. Generalidades ., (T)

Figura 5.9.

Representación esquemática de la variación de la energía de Fermi en función de la temperatura, en un gas bidimensional de electrones libres, de acuerdo con (5.5-18).

se muestra en la figura 5.10 para varios valores de temperatura. Puesto que sólo una partícula puede ocupar un estado cuántico dado, el valor de f(e) para una distribución de Fermi a una energía partícular es justamente igual a la probabilidad de que un estado cuántico de dicha energía esté ocupado. En el cero absoluto, como se puede ver fácilmente en la figura 5.10 y por la ecuación (5.5-20), la función de distribución de Fermi se convierte sencillamente en una función de escalón f(e)

=1

(e< e1 )

=O

(e> e1 ).

(5.5-21)

Conforme aumenta la temperatura, los bordes del escalón se redondean y la función de distribución varía rápidamente desde casi la unidad hasta casi cero sobre un rango de energía de algunos múltiplos de kT alrededor del valor e = e1. Al mismo tiempo, el valor de e¡ cambia y la variación ilustrada en la figura 5.10 es aproximadamente la que se asocia con el gas electrónico tridimensional, cuya densidad de estados está dada por (5.2-22). A temperaturas muy elevadas, la función de

Figura 5.10.

Representación esquemática de la función de distribución de Fermi para cuatro diferentes temperaturas. Obsérvese la variación de la energía de Fermi con la temperatura. La dependencia de la energía de Fermi en relación a la temperatura, tal como se muestra aquí, es típica para un gas tridimensional de electrones libres; pero la variación real en cualquier sistema en particular depende críticamente de la función de densidad de estados (o nivel de degeneraciones) del sistema.

Estadístictl de Fermi-Dirac

173

distribución pierde su característica de escalón y varía con más lentitud en función de la energía. De acuerdo con (5.5-20), es evidente que el valor de !(e) a e= e¡ es sólo l/2, es decir,

(e1 )

=t.

(5.5-22)

de donde, un estado cuántico al nivel de Fermi tiene la probabilidad de ocupación de l/2. En la figura 5.11 se muestra la distribución real de la densidad de partículas .V(e) como una función de la energía para un gas de Fermi de partículas independientes, dada por (5.5-13) con la función de densidad de estados (5.2-22). Nuevamente, en T =O, la curva tiene un carácter escalonado; así la porción para la que (e< e¡) es la parábola de densidad de estados (5.2-22) y para la que (e> e¡) es .:ero. Al aumentar la temperatura, este aspecto escalonado se hace cada vez menos pronunciado, como se ilustra en el dibujo. A temperaturas bajas, cuando la función de distribución de Fermi es escalonada, se dice que la distribución está sumamente degenerada. A temperaturas bajas, la distribución de Fermi-Dirac se puede representar como una esfera en el espacio de cantidad de movimiento en el que todos o casi todos los estados cuánticos de energía menor que e1 están llenos, en tanto que todos o la mayoría de los estados de energía mayores que e1 están vacíos. De acuerdo con f 5.2-14), la ecuación de la superficie de esta "esfera Fermi" debe ser Px2

+ Py2 + Pz2 = 2 me¡,

(5.5-23)

de donde, el radio es ..J2me1 , como se ilustra en la figura 5.12. A temperaturas muy altas, la superficie de la esfera de Fermi está definida muy deficientemente debido a la desaparición de bs aspectos escalonados de j(f), y el concepto resulta menos útil. Entonces, se llega a la conclusión que ta integral (5.5-15) no puede evaluarse en forma exacta y esto no permite encontrar una expresión simple para la energía de Fenni de un gas de Fermi tridimensional a todas las temperaturas; sin embargo el .:arácter simple (5.5-21) que adopta la función en T= O permite evaluar er de un modo muy sencillo en el cero absoluto. Si se utiliza (5.5-:ll) para representar !(e) en T =O, se puede volver a escribir (5.5-14) utilizando la función de densidad de estados (5.2-22) como N = 8J2nm 312 V h3

r•¡(O) Jede

Jo

= 16j2nm 3 ' 2 [e¡(0)] 3 ' 2

3h 3

(5.5-24)

N(.)

Figura 5.11.

Representación esquemática de la densidad electrónica como función de la energía asociada a un gas tridimensional de electrones libres.

174 Mecánica estadística. Generalidades

( r- eje .lal papel l

Figura 5.12.

La distribución de Fermi al cero absoluto correspondiente a un gas de electrones libres, representada, por medio de una esfera de electrones dentro del espacio de cantidad de movimiento. Esta representación es útil siempre y cuando T
Resolviendo esta ecuación para ej(O), se obtiene

(3N)2/3 .

h2 e¡(O) = - 8m 1rV

(5.5-25)

De un modo similar, se puede obtener la energía interna de un gas de Fermi al cero absoluto, siendo el resultado

U0

_

1th 2

V- 40m

3_3N (3N) 1rV -5 V e¡(O). 5'

(5.5-26)

Los detalles de estos cálculos se omiten, pero se proponen como ejercicio para el lector. Para energías mucho mayores que er, e<e-e¡)fkT es mucho mayor que la unidad y para tales energías, la función de dÍstribución de Fermi-Dirac (5.5-20) se puede escribir aproximadamente como (5.5-27)

Si todas las energías disponibles para el sistema satisfacen la condición

e- e1

~

kT,

(5.5-28)

es decir, si e¡ es muchas unidades kT menor que cualquier energía que pueda tener una partícula perteneciente al sistema, entonces (5.5-27) constituirá una buena aproximación de (5.5-20) para todas las partículas del sistema. Sin embargo, la función de distribución aproximada (5.5-27) es, sencillamente, la función de distribución de Maxwell-Boltzmann de (5.4-6) con a= e¡/kT. Entonces, si se conserva la condición (5.5-28) para todas las partículas del sistema, la distribución Fermi-Dirac y la de Maxwell-Boltzmann son casi iguales.

Estadística de Fermi-Dirac

175

Para el gas bidimensional de Fermi, donde la energía de Fermi está dada por (5.5-18), si T es tan grande que kT'> e¡(O), el exponente e¡(O)/kT será pequeño, de tal manera que el exponencial se puede aproximar mediante 1 + [e¡(O)/kT], dando

e (T) = kT In e¡(O) 1 kT =

81

(O)[ kT 1 B¡(O)] e1(0) n kT kT

kT]

= -e¡(O) [ e¡(O) In e¡(O) .

(5.5-29)

De acuerdo con esto, se advierte que conforme T aumenta, e¡(T)-+- oo. Puesto que la energía más baja que puede tener cualquier partícula del sistema es cero, es evidente que la condición (5.5-28) se satisfará para temperaturas lo suficientemente altas y la función de distribución será aproximadamente la misma que la de la distribución de Maxwell-Boltzmann a temperaturas muy elevadas. Se puede demostrar que el mismo resultado se aplica al caso tridimensional. Estos resultados también pueden esperarse si se emplea un enfoque físico, ya que a altas temperaturas, las partículas se distribuyen sobre un rango muy amplio de estados energéticos, y el número de partículas en cada rango de energías disponibles es tan pequeño que siempre hay mucho más estados cuánticos disponibles que partículas que puedan ocuparlos. En estas circunstancias, la probabilidad de que dos o más partículas ocupen el mismo estado cuántico siempre se hace sumamente pequeña de modo que no importa mucho si la función de distribución obedece al principio de Pauli (distribución Fermi-Dirac) o no lo obedece (distribución Maxwell-Boltzmann). 3 Puesto que la cantidad e¡(O), que deber ser obligatoriamente mucho menor que kT para que las dos distribuciones coincidan, es proporcional a la densidad de partículas N/A por (5.5-19), la reducción de la distribución de Fermi a una reducción de Maxwell-Boltzmann se desarrollará a temperaturas más bajas en gases menos densos. Por las mismas razones, de acuerdo con ( 5.5-19), se producirá a temperaturas más bajas en gases en las que la masa de las partículas m sea grande. Debido a ello, las substancias gaseosas ordinarias a temperaturas normales obedecen a la estadística de MaxwellBoltzmann mejor que a la estadística Fermi-Dirac (o Bose-Einstein). Sin embargo, para un gas denso de partículas muy ligeras, tales como los electrones libres de un metal, la energía de Fermi al cero absoluto es bastante grande y la condición (5.5-28) se puede satisfacer para todas las partículas del sistema sólo a temperaturas tan altas que sean físicamente inalcanzables. Por tanto, cuando se trata de un gas denso de electrones libres, debe utilizarse la estadística de Fermi-Dirac. No obstante, en los semiconductores, la forma peculiar de la función de densidad de estados es tal que la distribución de Maxwell-Boltzmann casi siempre es una aproximación aceptable de la distribución de Fermi-Dirac o prácticamente igual a ella. Esta situación se examinará más detalladamente en un capítulo posterior. 3 Se podría alegar que aun en este límite la distribución de Fermi-Dirac debe diferir de la de Maxwell-Boltzmann en virtud de que no se pueden identificar las partículas. Sin embargo, se puede demostrar, como se verá en la siguiente sección, que la función de distribución de partículas no distinguibles, que no obedecen el principio de exclusión de Pauli (la distribución Bose-Einstein), se aproxima a la función de distribución Maxwcii-Boltzmann en este límite. Una forma más exacta de explicar la situación sería afirmar que, en el límite de altas temperaturas, la distribución Fermi-Dirac se acerca a la distribución Bose-Einstein que, a su vez, se acerca a la distribución Maxwell-Boltzmann.

176 Mecánica estadística. Generalidades Si se hubiera escogido para el multiplicador (3, otro, diferente al dado por (5.5-10), no se habría encontrado, por lo general, la correspondencia entre los sistemas Fermi-Dirac y Maxwell-Boltzrnann en el límite de las temperaturas altas que, como ya se vio, se puede esperar por razones físicas. Por tanto, se debe llegar a la conclusión de que el valor de (3 dado por (5.5-10) está físicamente justificado.

5.6

LA DISTRIBUCION HOSE-EINSTEIN

En la sección anterior se demostró que la distribución estadística de FermiDirac (5.5-20) es la que caracteriza el comportamiento de un conjunto de partículas no distinguibles que obedecen al principio de exclusión de Pauli. Puesto que no todas las partículas elementales obedecen el principio de Pauli (siendo la excepción más conspicua los fotones), es necesario considerar el comportamiento de las partículas no distinguibles, que no obedecen este principio. También en este caso, puesto que las partículas no están numeradas, el factor ( 5.3-7) se reduce a la unidad y sólo es necesario considerar las posibles permutaciones de N¡ partículas idénticas entre g¡ estados cuánticos de iésimo nivel energético; pero ahora sin ninguna restricción en lo que respecta al número de partículas que pueden ocupar cualquier estado cuántico dado. Sea un arreglo lineal de N¡ partículas y g¡ - 1 particiones que serían necesarias para dividir estas partículas en g¡ grupos, como se ilustra en la figura 5.13. No es difícil ver que el número de formas de permutar las N¡ partículas entre g¡ niveles, es igual al número de permutaciones independientes de objetos y particiones de la figura 5.13. Puesto que se tiene un total de N¡+ g¡- 1 partículas más las particiones, éstas se pueden arreglar linealmente en (N¡+ g¡- 1)! formas; pero puesto que las permutaciones que se hacen entre las partículas y entre las particiones no se consideran como acomodos independientes, el número de acomodos se debe dividir entre el número de maneras de permutar las partículas entre ellas mismas (N¡! ) y nuevamente entre el número de maneras de permutar las particiones entre ellas mismas ((g¡- 1)! ), dando (N;+ g¡- 1)! N;!(g;- 1)!

(5.6-1)

formas de realizar una distribución de N¡! partículas no distinguibles entre g¡ estados que pueden alojar a cualquier número de partículas. Fl número Qb de formas estadísticamente independientes de lograr una distribución (N 1 , N 2 , • • • Nn) de partículas entre los niveles energéticos del sistema, de acuerdo con estas reglas, es

•• •

•• •• ••

• ••• •

iésimo nivel de energía: degene.r.ación 9; =9 poblac10n N;= 14 Figura 5.13.

Una posible distribución de partículas entre los estados cuánticos del iésimo nivel de un sistema en el que no se aplica el principio de exclusión de Pauli.

< ncr?,ético

La distribución de Rose-Einstein

177

simplemente el producto de los factores de la forma (5.6-l) sobre todos los niveles del sistema por lo que (5.6-2) Ahora se puede maxlinizar esta cantidad con r~specto a las variables N¡, N 2 : • • • Nn, utilizando el método de los multiplicadores de Lagrange y de acuerdo con las restricciones (5.3-22) y (5.3-23). Los cálculos no se incluirán aquí; pero se sugiere que los ejecute el lector como ejercicio. El resultado es

1

(5.6-3)

Esta fórmula se conoce como función de distribución Bose-Einstein. También ahora se puede identificar (3 como

{3 = -1/kT,

(5.6-4)

mientras que a puede determinarse de acuerdo con el número de partículas del sistema, al igual que se hizo en los casos Maxwell-Boltzmann y Fermi-Dirac. Para el caso de un continuo de niveles muy poco espaciados entre sí, g¡ ~ g(c)d€ y N¡~ N(c)dc, lo cual da (5.6-5) Para la función de densidad de estados de partículas independientes ( 5.5-16) correspondiente a un gas bidimensional de partículas libres, el parámetro a se puede calcular explícitamente en la misma forma que e¡ para este sistema, de acuerdo con la estadística Fermi-Dirac. Se puede demostrar entonces que conforme T se incrementa, a~- oo, en cuyo caso el factor exponencial del denominador de (5.6-5) se hace mucho mayor que la unidad y la distribución Bose-Einstein (5.6-5) tiende a (5.6-6) que es una función de distribución del tipo de Maxwell-Boltzmann. Se puede obtener el mismo comportamiento general para un gas de Base-Einstein tridimensional de partículas independientes, aunque en este caso no es posible obtener una expresión para a en forma exacta. En el límite de las temperaturas muy altas, las partículas del sistema se distribuyen sobre un rango muy amplio de energía, y el número de partículas en cada rango de energía disponible será mucho más pequeño que el número de estados cuánticos de dicho rango, de donde, para todos los estados g¡ :>N¡. En esta situación, se puede escribir, aproximadamente, (N; + g¡ - 1)! ~ N; (g¡-1)! =g¡,

(5.6-7)

de donde, (5.6-2) se convierte en (5.6-8)

178 Mecánica estadística. Generalidades Cabe notar que esto, aparte de un factor constante N! , es igual a Q(N 1 , N 2 , • • • Nn) como está dado por (5.3-8) para un sistema Maxwell-Holtzmann. Entonces, desde un punto de vista puramente físico se debe esperar que las distribuciones Hose-Einstein y Maxwell-Holtzmann coincidan en el límite de altas temperaturas. La selección del valor dado por (5.6-4) para (j está entonces justificado, ya que esta selección, como se vio antes, lleva directamente a la correspondencia entre la estadística Hose-Einstein y Maxwell-Boltzmann indicada por (5.6-6). En el caso de los gases bidimensional y tridimensional de partículas independientes de Hose-Einstein, conforme la temperatura se acerca a cero, el valor de a tiende a cero y el resultado es que todas las partículas del sistema tienden a condensarse en el estado energético más bajo del sistema al cero absoluto. Este fenómeno, denominado condensación de Hose, es característico de los sistemas que obedecen la estadística de Bose-Einstein. En algunas aplicaciones, conviene obtener la función de distribución BaseEinstein, sin establecer la restricción de que el número de partículas del sistema sea constante. De acuerdo con (5.3-15) y (5.3-16), se puede ver que este resultado se puede obtener de (5.6-5), si se supone que a es idéntica a cero. En este caso, (5.6-5) se reduce a f(e) =

1 e/kT

e

· - 1

(5.6-9)

EJERCICIOS l. Demuestre que el frente de onda asociado con la onda plana 'Ir= ei(k•r-wt) avanza en la dirección k. 2. Demuestre, para la partícula libre en tres dimensiones cuya función de onda está dada por (5.2-7), que el valor esperado de la cantidad de movimiento vectorial p es igual a hlc, y que p (y, por ende, k) es una constante del movimiento. 3. Calcule la densidad del factor de estados g(e)de para un sistema bidimensional de partículas libres, en el que no hay otras interacciones que colisiones instantáneas y que está contenido en un recipiente rígido de superficie A y de dimensiones x 0 y y 0 . Comience con la ecuación de SchrOdinger. 4. Suponga que se lanzan simultáneamente cuatro monedas, ¿cuáles son las probabilidades asociadas con las distribuciones (0 águila, 4 sol), (1 águila, 3 sol) ... (4 águila, O sol)? 5. Encuentre las dimensiones y la superficie del rectángulo de área máxima con lados paralelos a los ejes de las coordenadas, que se puede inscribir dentro de una elipse cuyo eje mayor es 2a y cuyo eje menor es 2b. Los ejes de la elipse pueden considerarse paralelos con los ejes de las coordenadas. Emplee el método de los multiplicadores de Lagrange. 6. Encuentre la velocidad de raíz cuadrada media y la velocidad más probable de una partícula en un gas ideal de Boltzmann. 7. Demuestre que el flujo de partículas en un gas ideal de Boltzmann, cuyas componentes x de velocidad son positivas, por unidad de área sobrt> un plano normal al eje x es -!Nc7V. Nota: el flujo o densidad de corriente se define como el número de partículas por unidad de volumen por su componente de velocidad a lo largo de la normal al plano sobre el que se observa el flujo. 8. Demuestre que la energía de Fermi de un gas de Fermi bidimensional de partículas libres cuya función de densidad de estados está dada por el resultado del ejercicio 3, es ej{T) = kTin(eEj{O)fkT- 1), en donde et{O) =Nh2f(4rrmA) 9. Calcule la energía de Fermi, en electrón-volts, para los electrones libres en el cobre al cero absoluto, suponiendo que hay un electrón libre por átomo de cobre. Indique la temperatura a la que kT será igual a ef.O). 10. Demuestre que la energía interna por unidad de volumen de un gas de Fermi de

partículas libres al cero absoluto es

~!!.. ej(O). 5 V

11. Demuestre por el método de los multiplicadores lagrangeanos, que si Q(N ¡, N 2 , • • • Nn) está dada por la ecuación (5 .6-2), la función de distribución correspondiente a los valores más probables dé N •· N2, • • • Nn, está dada por (5.6-3).

La distribución de Rose-Einstein

179

12. Use la función de densidad de estados calculada en el ejercicio 3 para demostrar que a de un gas de Bose-Einstein bidimensional de partículas libres está dado por

d parámetro

IX=

)n(l _

e-h2N/(2nAmkT)).

Analice las propiedades de la función de distribución resultante para T--'>- oo y para T-+ O.

LECTURAS RECOMENDADAS W. Band, An Introduction to Quantum Statistics, D. Van Nostrand, Princeton, N. J. (1955). R. W. Gurney, Introduction to Statistical Mechanics, McGraw-Hill Book Co., lnc., Nueva York (1949). D. ter Haar, Elements of Statistical Mechanics, Holt, Rinehart and Winston, lnc., Nueva York (1954). R. B. Lindsay, Introduction to Physical Statistics, John Wiley and Sons, Nueva York (1941). J. E. Mayer y Maria Gi:ippert-Mayer, Statistical Mechanics, John Wiley and Sons, Nueva York (1940). R. C. Tolman, The Principies of Statistical Mechanics. Oxford University Press, Londres (1938).

CAPITULO

6

Vibraciones reticulares y propiedades térmicas de los cristales 6.1

CALCULOS CLASICOS DEL CALOR ESPECIFICO RETICULAR

En la sección 4.4 se delinearon algunos de los problemas que se presentan cuando se calcula el calor especifico de un cristal, suponiendo que los átomos de dicho cristal se comportan como osciladores armónicos clásicos independientes. Ahora se examinarán estos problemas detalladamente y se estudiará la forma en que se pueden resolver, usando los resultados obtenidos en los capítulos 3-5, relacionando la dinámica reticular, la mecánica cuántica y la mecánica estadística. En todas estas investigaciones se tratará de un cristal compuesto de N átomos, que se mantienen unidos en un arreglo periódico. Se supone que estos átomos sólo pueden vibrar alrededor de sus posiciones de equilibrio ya que están sometidos a fuerzas restrictivas que, en una primera aproximación, obedecen a la ley de Hooke. También se supone que no hay electrones libres, como se encontrarían en un metal, y que toda la capacidad calorífica del cristal se debe a las vibraciones de la red producidas por excitación térmica. Cuando hay electrones libres, también, se puede lograr que se muevan excitándolos por medio de una fuente calorífica externa y, entonces, su movimiento ocasiona un aumento en el calor específico observado; esto se estudiará en un capítulo posterior. El cálculo clásico supone que cada átomo es un oscilador armónico clásico tridimensional que vibra independientemente de todos los demás átomos del cristal. En estas circunstancias, se puede calcular la energía térmica interna total del cristal determinando la energía promedio de un solo oscilador y multiplicando el resultado por N. Para un solo oscilador armónico isotiópico tridimensional, la energía total es p2 e=-+ V(r)

(6.1-1)

2m

siendo (6.1-2) en donde m es la masa y w 0 la frecuencia natural del oscilador. Si se supone que la distribución de los osciladores por energía obedece a la ley de distribución MaxwellBoltzmann, la función de distribución que expresa la probabilidad de que un oscilador tenga una energía dada E es pl

mwo2r2

f(c.) = Ae-•lkT = Ae- 2mkT e- 2fT= f(p,q) 181

(6.1-3)

182

Vibraciones reticulares y propiedades térmicas de los cristales

en donde A es una constante. De acuerdo con (5.2-4), la energía promedio está dada por

(6.1-4) En este caso se prefirió usar coordenadas esféricas (r, e, cf>) para el espacio de las coordenadas y (p, eP, cf>p) para el espacio de la cantidad de movimiento, para fines de integración la cual, por supuesto, debe hacerse sobre todo el espacio de fase. Puesto que el integrando no tiene dependencia en relación de e, p, ep, o 'cf>p la integración sobre estas variables se puede desarrollar de un modo muy sencillo, dando un factor de 41T tanto al numerador como al denominador, y dejando

foo p4e- 2~~T dp m;~ foo r4e- m~~~z dr 2m o foo pZ + foo o mm >rZ -

_1_ (e) =

0

p2e2mkT dp

o

(~ ) "k

+ (~"p) •

(6 1 5) • -

r2e 2kT dr

o

En el primer término de (6.1-5), cada doble integral de (6.1-4) se ha expresado como un producto de una integral p y otra integral r; las integrales r del numerador y el denominador son iguales y se anulan, dando el primer término de la expresión antes presentada. El segundo término se maneja en la misma forma; pero en este caso las integrales de p del numerador y el denominador son las que se cancelan. Es evidente que el primer término de la expresión anterior representa la energía cinética promedio y el segundo la energía potencial promedio. Al evaluar las integrales con la ayuda de la tabla 5.1, se encuentra que (6.1-6)

Para un conjunto de N oscilaciones independientes, la energía interna total U es, sencillamente, U= N(e) = 3NkT,

(6.1-7)

y la capacidad térmica Cv es, por definición, Cv = (8Uf8T)v = 3Nk.

(6.1-8)

El calor específico es la capacidad calorífica por gramo (o por unidad de volumen). La capacidad calorífica es una constante independiente de la temperatura. Para un mol de cualquier substancia, N es igual al número de Avogrado Na y la capacidad calorífica molar Cvm está dada por (6.1-9)

Este resultado se conoce como la ley de Dulong y Petit, y los alumnos que han estudiado química elemental están familiarizados con ella ya que es la base de una forma rudimentaria de estimar el peso atómico de un elemento desconocido. La

Teoría de Einstein sobre el calor específico

183

Cvm

~i"!'O:....__~I0'-0---2-'0-0---30-'--0---4.L.OO--- T ("K)

Figura 6.1.

Capacidad térmica de una substancia sólida típica graficada como una función de la temperatura.

ley de Dulong y Petit concuerda totalmente con los resultados experimentales obtenidos con la mayoría de las substancias a la temperatura ambiente y por encima de ella; pero conduce a errores notables a temperaturas bajas. En el rango de temperaturas bajas, el calor específico de todas las substancias tiende a cero siendo proporcional a P conforme T se acerca a cero, como se ilustra en la figura 6.1.

6.2

TEORIA DE EINSTEIN SOBRE EL CALOR ESPECIFICO

Einstein investigó las discrepancias en la teoría clásica del calor específico y, en 1911, logró explicar cualitativamente el calor específico (por lo menos en su forma observada y desde un punto de vista experimental) como una función de la temperatura. En la teoría de Einstein, los átomos se consideraban nuevamente como osciladores armónicos independientes e idénticos con una sola frecuencia de vibración natural w 0 , pero se toman como osciladores cuánticos armónicos que pueden tener sólo valores discretos de energía 1 tales que

(n

= 0,1,2, · · · ),

(6.2-1)

como está dado por ( 4.12-27). Se puede considerar que los osciladores tienen una distribución de energía del tipo Maxwell-Boltzmann, ya que forman un conjunto de sistemas que son distinguibles o identificables en virtud de su ubicación en puntos separados y distintos de la red, y puesto que cualquier número de osciladores puede estar en cualquier estado cuántico del sistema. Por tanto, aunque los átomos son osciladores cuantizados, la distribución clásica de Maxwell-Boltzmann sigue siendo la más apropiada para describir su comportamiento estadístico. Por otro lado, los verdaderos cuantos de energía vibratoria que absorben o emiten los osciladores, no son entidades distinguibles y, por tanto, la estadística de Bese-Einstein se debe utilizar 1 Por supuesto, Einstein utilizó el resultado de Planck En = nl'k.u más bien que el resultado de la mecánica ondulatoria que se da en (6.2-l) para los niveles de energía de un oscilador armónico. Si se usa el resultado original de Planck, la expresión final de la energía interna y el calor específico que se obtienen difieren de los resultados aquí derivados, ~ólo en la
184

Vibraciones reticulares y propiedades térmicas de los cristales

para describir su comportamiento estadístico. Como se verá más tarde, se pueden obtener los mismos resultados analizando las propiedades del sistema de osciladores de acuerdo con la estadística Maxwell-Boltzmann, o bien manejando la dinámica de los cuantos de energía vibratoria por medio de la estadística de Bose-Einstein. Para mayor simplicidad, se supondrá que el cristal contiene 3N osciladores armónicos unidimensionales cuyos niveles de energía están dados por (6.2-l), en lugar de N osciladores isotrópicos tridimensionales. Esta suposición se justifica, ya que existen tres grados de libertad de vibración independiente relacionados con cada átomo del cristal y que, de acuerdo con el principio de equipartición, la energía vibratoria disponible se distribuye de un modo equitativo, en promedio, entre estos tres grados de libertad. Si la energía se distribuye entre los osciladores de acuerdo con la ley de Boltzmann, el número de osciladores a la energía e es proporcional a e- efKT y la energía promedio es

(6.2-2)

¿ e
en donde

x = -liw0 /kT.

(6.2-3)

Sin embargo, la ecuación 6.2-2 se puede escribir como

(6.2-4) La energía interna se obtiene multiplicando la energía promedio por oscilador, por el número de osciladores, como antes, de donde, 3Niiw 0 U= 3N(e) = --2-

3Niiw 0

+ eftwa/kT-

(6.2-5)

1

y

e = (-aaTu_) V

= V

3 N k (-liw_o) 2 ---;:--e~=Wo,...lk_T--:: kT (eftwo/kT- 1)2.

Este resultado se puede expresar en una forma algo más una "temperatura de Einstein" 8¡.; tal que

liw 0 =

k0E.

(6.2-6) s~ncilla

definiendo

(6.2-7)

Al substituir k8E en lugar de hw 0 en (6.2-6), se tiene que

(6.2-8)

Teoría de Einstein sobre el calor específico

185

Para temperaturas lo suficientemente altas para que T~ eE, e0 EIT:::: 1; utilizando la expansión de series de potencias para la exponencial y reteniendo sólo los términos de primer orden, se puede ver fácilmente que en este límite, Cv se acerca al resultado clásico 3Nk. Para temperaturas bajas (T <1!; SE), e0 EIT ~ 1 y (6.2-8) se puede aproximar mediante (6.2-9) .:¡ue se acerca a cero conforme T tiende a cero, aunque no concuerda con el comportamiento T3 observado a temperaturas bajas. El primer término de (6.2-5) representa la parte de energía interna del sistema que corresponde a la energía de punto ~ero de los osciladores. Puesto que es independiente de la temperatura, no hace \·ariar el valor del calor e~pecífico. Físicamente, la razón de que el calor específico se haga tan pequeño a temperaturas bajas se puede entender suponiendo que el cristal se coloca de tal modo que hace contacto con un baño térmico externo compuesto de un gas monoatómico ideal a una temperatura dada y se deja que absorba energía de los átomos del gas ideal. La energía promedio de los átomos del gas es 3/2kT y si la temperatura del sistema es lo suficientemente alta, de tal modo que kT sea por lo menos del orden de la energía líw 0 requerida para excitar uno de los átomos vibrantes del cristal a un estado energético más alto, tales excitaciones ocurrirán frecuentemente, al chocar ~on el cristal los átomos del gas del baño térmico. Entonces, estas colisiones serán inelásticas en el sentido mecánico y la energía que inicialmente pertenecía a los átomos del gas se transferirá con facilidad a la red cristalina como energía de \"ibración. Por otro lado, a temperaturas lo suficientemente bajas, kT será mucho más pequeña que la energía de excitación líw 0 , y sólo un átomo ocasional de gas que tenga una energía mucho mayor que la promedio podrá producir una excitación de esta índole y, por tanto, transferir calor a la red cristalina. Luego, el cristal tiene relativamente poca capacidad para absorber calor de su ambiente y un cambio unitario de temperatura en el ambiente sólo ocasiona la transferencia al cristal de una cantidad de calor muy pequeña, en comparación con la que se puede transferir en conniciones similares a temperaturas más altas. Conforme la temperatura se acerca al cero absoluto, la fracción de átomos del baño térmico que poseen la mínima energía de excitación hw 0 tiende a cero, y en consecuencia, también lo hace el calor específico. La temperatura de Einstein SE = líw 0 /k se puede calcular fácilmente si se conoce w 0 . Esta frecuencia natural de vibración se puede calcular a partir de la masa atómica y las constantes elásticas observadas del cristai.2 Para muchos elementos metálicos, el valor calculado de esta manera es del orden de 100-200°K y, por ende, la transición del comportamiento a bajas temperaturas al de altas temperaturas debe ocurrir en este rango de temperaturas. Experimentalmente, se ha encontrado que la teoría de Einstein satisface las observaciones en todas las temperaturas, excepto las bajas, en donde el comportamiento de T3 observado no se puede obtener. Por lo general, los valores calculados de SE y los que se obtienen aplicando la expresión teórica (6.2-8) a datos observados, también concuerdan con bastante exactitud. Evidentemente, la teoría de Einstein proporcionó una explicación mucho mejor de los datos experimentales que la teoría clásica, a pesar de que la coincidencia con la experiencia no es perfecta. La teoría de Debye, de 1912, permitió eliminar la discrepancia entre la teoría y Jos resultados experimentales a baja temperatura y mejoró la aceptación general de Jos datos experimentales. En la teoría de Debye, se toman en 2

Véase el capítulo 3, ejercicio 6.

186

Vibraciones reticulares y propiedades térmicas de los cristales

cuenta las interacciones entre los átomos que dan como resultado que exista un rango de valores posibles de frecuencia vibratoria en lugar de un solo valor Wo, como se describió en el capítulo 3.

6.3

TEORIA DE DEBYE SOBRE EL CALOR ESPECIFICO

La teoría de Debye sobre el calor específico, primeramente propuesta en 1912, 3 consideraba a los átomos de los cristales como osciladores que están acoplados y que pueden propagar ondas elásticas cuya frecuencia varíe sobre un amplio rango de valores, como lo predicen los cálculos del capítulo 3. Aunque todavía se obtienen algunos resultados que son aproximaciones, se encontró que eran superior al modelo de Einstein en lo que respecta a las predicciones sobre el calor específico de substancias en la región de temperaturas bajas. Además, proporcionó una base para varias investigaciones subsecuentes más detalladas. Puesto que de acuerdo con lo anterior, los átomos del cristal no vibran independientemente unos de otros, es más conveniente trabajar con los modos normales de vibración del sistema, que con el movimiento vibratorio de un solo átomo. Ya se vio (en la sección 3.3 y el ejercicio 7, capítulo 3), que para una cadena lineal unidimensional de N átomos, existen esencialmente N modos normales de vibración. En el caso de un cristal tridimensional de N átomos, cada átomo puede vibrar independientemente a lo largo de las tres direcciones de las coordenadas, de manera que, para este sistema, se tienen 3N modos normales posibles. Puesto que cualquier movimiento vibratorio del sistema se puede considerar como una superposición de vibraciones independientes de modo normal, los modos normales se pueden tomar como oscilaciones armónicas independientes cuyos niveles de energía permisibles están dados por (6.2-1) y cuya energía promedio está dada por (6.2-4), a condición de que el número de modos normales excitados estén distribuidos en cuanto a energía de acuerdo con la ley de distribución de Maxwell-Boltzmann. Supóngase ahora que en un rango de frecuencia dw alrededor de la frecuencia w, existen g( w) dw modos normales de vibración del cristal. En consecuencia, la cantidad g(w) debe representar el número de modos normales por unidad de frecuencia a la frecuencia w. El aumento de la energía vibratoria interna del cristal, producido por estos modos de vibración, está dada por dU

= (e(w))g(w) dw

(6.3-1)

en donde (e(w)) es la energía promedio de un modo de vibración de frecuencia w, según lo establece la fórmula (6.2-4). Es más conveniente calcular el número de modos normales g(k) dk en un intervalo dk alrededor del número de onda k, y, puesto que dk = (dk/dw)dw (6.3-1) se puede escribir como dU

dk dw

= (e(w(k)))g(k) dk = (e(w))g(k)- dw.

(6.3-2)

Para calcular g(k), sea un cristal rectangular cuyas dimensiones son (Lx, Ly, Lz) y supóngase que el origen se encuentra en un vértice del cristal, y que los bordes del cristal coinciden con los ejes + x, +y y + z. Las ecuaciones de movimiento de ~

P lkhyc, Ann. Physik 39, 789 (1912).

Teoría de Debye sobre el calor específico

187

la amplitud mecánica vibratoria u(x, y, z, t), conduce entonces a soluciones vibratorias de la forma

(6.3-3) Si a la expresión (6.3-3) se aplican las condiciones periódicas de frontera de la forma

u(L",y,z,t) = u(O,y,z,t) u(x,L,,z,t) = u(x,O,z,t)

(6.3-4)

u(x,y,L.,t) = u(x,y,O,t)

k" = 21tnxf L" k,= 21tn,JL,

(6.3-5)

en donde nx, ny, nz son enteros positivos o negativos. Los valores permisibles (kx, ky, kz), a los cuales corresponde un solo modo normal de vibración que satisfacen las condiciones periódicas de frontera, se pueden graficar como puntos en un espacio k ortogonal, como el que se ilustra en la figura 6.2. Los modos normales permisibles forman una red ortorrómbica simple en este espacio, siendo las dimensiones de la célula unitaria (2rr/Lx, 2rr/Ly, 2rr/Lz).

Figura 6.2.

Superficies esféricas corre~pondientes a valores constantes de la constante de propagación k Y k +dk, graficadas en un sistema de coordenadas (kx, k y, kz)·

Si las dimensiones del cristal Lx, Ly, Lz son lo suficientemente grandes, la célula unitaria se hará pequeña y los puntos que representan los modos normales permisibles se amontonarán en un modo muy semejante al diagrama que aparece en

188

Vibraciones reticulares y propiedades térmicas de los cristales

la figura 6.2. En este caso, se puede calcular g(k) dk, evaluando el volumen del espacio k entre la superficie esférica de radio k (6.3-6) que es el lugar geométrico de todos los puntos correspondientes al número de onda k, y otra superficie esférica de radio k + dk, que es el lugar geométrico de todos los puntos cuyo número de onda es k+ dk. El volumen requerido es, sencillamente, el comprendido entre las dos esferas de la figura 6.2 o 47Tk 2 dk. El número de modos normales permisibles se obtiene dividiendo esta cantidad entre el volumen de la célula unitaria correspondiente a un solo modo normal del sistema. Este volumen es 87T 3 f(LxLyLz) = 87T 3 /V, en donde V es el volumen del cristal. Este procedimiento da como resultado el valor

g(k) dk =

k2V -2 2n

dk.

Sin embargo, existen en realidad tres modos normales independientes para cada punto permisible en el espacio k, uno correspondiente a una vibración longitudinal (que ya se vio antes) y los otros dos que corresponden a dos vibraciones transversales mutuamente ortogonales que, hasta ahora, no se han considerado en este análisis. Para tomar en cuenta esas posibilidades, el lado derecho de la ecuación anterior debe multiplicarse por un factor de 3, lo cual da finalmente 3k 2 V 2n

g(k) dk = - - 2 dk.

(6.3-7)

En este punto, se desearía utilizar alguna relación como la (3.3-7) que expresa la variación de k como una función de w para una red monoatómica, encontrando dk/dw y substituyendo los resultados junto con (6.3-7) y (6.2-4) en (6.3-2), e integrando finalmente sobre w. Born y von Karman, 4 fueron los primeros en delinear este procedimiento. Desafortunadamente, la forma matemática de la ecuación es tal que la expresión resultante es demasiado compleja y no se puede integrar en forma cerrada o manejarse numéricamente de un modo conveniente. Para contrarrestar esta dificultad, Debye aproximó la función sinusoidal (3.3-7) escribiéndola como una función lineal: w(k) = v0 k

(6.3-8)

en donde v0 es una velocidad de fase (constante) la cual, en principio, es igual a la velocidad del sonido de onda larga en el cristal. En realidad esto es, lo que indica (3.3-7) con respecto a longitudes de onda lo suficientemente grandes para satisfacer la condición ka~ 1T, pero Debye utilizó la función para describir el comportamiento de todas las vibraciones que se pueden propagar dentro del cristal. La integración sobre w indicada en (6.3-2) se realiza entre los límites cero y una frecuencia máxima Wm que se escoge de tal forma que el número total de modos normales de frecuencia menores que Wm deben ser justamente 3N, ya que se sabe que éste es el número real de modos normales que existen para un cristal de N átomos. 5 Existe un número de onda km correspondiente a Wm y todos los modos 4

M. Born T. von KJrman, Physikalische /eitschrift U, 297 (1912).

5 Si hubiera sido posible usar una exprc~ión exacta para relacionar

w y k, la integración se habría desarrollado dentro de los límites de la primera zoua de Brillouin. Esto habría garanti!.ado que se hubiera satisfecho automáticamente la condición de que el número total de modos fu <'SC igual a 3N

Teoría de Debye sobre el color específico

189

nonnales para los que k< km tienen frecuencias w < Wm, de acuerdo con (3.3-7) o (6.3-8). Por tanto, debe haber solamente 3N modos nonnales de oscilación dentro de una esfera de radio km en el espacio k. Puesto que el volumen del espacio k ocupado por un solo modo normal es 81r 3 /3 V, se puede escribir 8n 3 4 -nk 3 = 3N · 3 "' 3V o bien (6.3-9) por lo cual, utilizando la aproximación de Debye (6.3-8), W 111

= Vokm = v0 (6Nn 2 /V) 113 •

(6.3-10)

La variación de w en función de k, de acuerdo con la aproximación de Debye, se ilustra y se compara con el valor dado por (3.3-7) en la figura 6.3. En (6.3-10)

"'

Figura 6.3.

La verdadera relación de dispersión (curva continua) y la relación de dispersión (curva punteada) de acuerdo con la aproximación de Debye.

se supone que la velocidad v0 es la misma para ondas elásticas longitudinales y transversales. Por lo general, esto no es cierto; pero la diferencia no es siempre lo suficientemente grande para que afecte el resultado final de un modo significativo. Si ahora se substituye (6.2-4) y (6.3-7) en (6.3-2), utilizando (6.3-8) siempre que sea necesario expresar k en función de w, e integrando desde cero hasta Wm, se obtiene

(6.3-11) La integral del primer término anterior se evalúa fácilmente y origina en el punto cero un aumento de la energía interna el cual, por otra parte, es independiente de la temperatura y no modifica en nada el calor específico. La integral del segundo ténnino no se puede evaluar en fonna exacta; pero se solucionará numéricamente.

190

Vibraciones reticulares y propiedades térmicas de los cristales

Por lo general, se acostumbra expresar estos resultados en una forma algo diferente. Si se hace que (6.3-12)

x = hwfkT, x

liv (6Nn ) = liwm /kT = ~ kT -V2

m

113

(6.3-13)

y (6.3-14) entonces, (6.3-12) se puede escribir en la forma

9

(T)

U=-Nk0+9NkT 0 8 "

3

fa¡T x 3 dx -x-· e-1 0

(6.3-15)

Como se puede ver, el parámetro e tiene las dimensiones de la temperatura y desempeña el papel de una temperatura característica en ( 6.3-15) más o menos en la misma forma que lo hace la temperatura de Einstein en (6.2-8). e se conoce generalmente como la temperatura de Debye. Por supuesto, es independiente de la temperatura, excepción hecha de la ligera variación de temperatura introducida por el cambio de V y de v0 al cambiar la temperatura. Al derivar (6.3-11), con respecto a la temperatura, se puede determinar la capacidad térmica y se demuestra fácilmente que el resultado es

(T)3 fa¡T x4ex dx o (ex- 1)2.

31i2V f"'m w4e~"'/kT dw Cv- 2n2v~kT2 o (e~"'/kT- 1)2- 9Nk 0

(6.3-16)

La integral de (6.3-16), que es una función exclusiva de e¡T, se puede evaluar de un modo númerico dando una función cuya gráfica se ilustra en la figura 6.4. A altas temperaturas T~ e y el término exponencial de la expresión central de (6.3-16) se pueden ampliar al igual que se hizo en relación con (6.2-8), obteniéndose una expresión que se puede integrar fácilmente; a continuación, usando (6.3-10) se puede demostrar que se obtiene el resultado clásico eV = 3Nk. A bajas temperaturas, 3Nit

v

~------------------

~~0~-----0~5--------~----~15-------2~0 ~8

Figura 6.4.

La capacidad térmica de un sólido monoatómico aislador, de acuerdo con la teoría de Debye, graficada en función de la variable de temperatura reducida T/e.

Teoría de Debye sobre el color específico

191

en la expreswn del lado derecho de ( 6.3-15), el límite de la integral se acerca a infinito y, por los métodos de integración de contorno, se puede demostrar que la integral definida resultan te es igual a rr4 115, dando

=e = 12n Nk(!.) (au) oT s e 4

V

3

(T

~E>).

(6.3-17)

V

Esto se conoce como la "Ley 'J'3 de Debye" y sus predicciones sobre los calores específicos en la región de temperaturas bajas concuerdan aceptablemente con los datos experimentales obtenidos con muchas substancias. El valor de la temperatura de Debye se puede calcular a partir de (6.3-14), u obtenerse experimentalmente seleccionando el valor de e con el que se obtenga la mayor concordancia entre los datos experimentales y la expresión teórica (6.3-16). Los valores calculados y los determinados de un modo experimental están casi siempre de acuerdo en el caso de substancias que obedecen las suposiciones hechas de acuerdo con la teoría de Debye. Para los elementos metálicos más comunes, la temperatura de Debye se registra generalmente en el rango de 150-450° K. Seitz 6 presenta una tabla de temperaturas de Debye y un análisis detallado de la concordancia entre los valores de la temperatura de Debye, calculados y determinados de un modo experimental. En un cristal, en el que los átomos no son todos idénticos, por ejemplo, el NaCl, se pueden excitar vibraciones elásticas pertenecientes a modos ópticos o acústicos, y los resultados calculados mediante este procedimiento ya no se pueden aplicar directamente en los cristales de este tipo. Sin embargo, los modos acústicos y los ópticos se pueden utilizar por separado. Los modos acústicos se pueden manejar mediante el procedimiento anterior, mientras que la variación de w con k para los modos ópticos es, como lo ilustra por ejemplo la figura 3.11, tan pequeña, que generalmente se obtiene una aproximación bastante buena al considerar los modos ópticos como vibracione3 de una sola frecuencia dada por (3.4-10). Los modos ópticos se pueden tratar mediante el método de Einstein, desarrollado en la sección anterior y los valores aportados por los modos óptico y acústico se combinan para dar la capacidad calorífica total del cristal. Blanckman, 7 • 8 estudió con cierto detalle éstas y otras modificaciones de la teoría primitiva de Debye, y llegó a la conclusión de que en ciertos casos específicos, el procedimiento de Debye puede llevar a errores notables y que en tales circunstancias, es mejor usar el procedimiento más exacto de Born-von Karman. Se suele pensar que una substancia metálica posee un gran número de electrones libres que pueden servir para producir en el metal un flujo de corriente al aplicarle un campo eléctrico, lo cual explica la gran conductividad eléctrica de los metales. Tomando esto como base, se podría esperar que los electrones libres adquirirían una energía cinética adicional cuando el cristal está cerca de una fuente térmica externa y que debido a ello habría un aumento notable en el calor específico. En realidad, y contrario a lo esperado, este aumento es tan pequeño que se puede pasar por alto a temperaturas mayores de aproximadamente 5° K. Por debajo de esta temperatura, en los cristales metálicos se puede distinguir una variación lineal del calor específico con respecto a la temperatura, que se debe efectivamente a los electrones libres. La explicación de este comportamiento peculiar del calor específico electrónico se dará en el análisis detallado que hace en el capítulo siguiente. 6 F. Seitz, Modern Theory o{ Solids, McGraw-Hill Book Co., Inc., Nueva York (1940), páginas 110-111. 7 M. B1ackman, Z. Physik 86, 421 (1933). 8 M. Blackman, Proc. Roy. Soc. 148, 384 (1935); 159, 416 (1937).

192

Vibraciones reticulares y propiedades térmicas de los cristales

6.4

EL FONON

Hasta ahora el calor específico de materiales sólidos se ha estudiado en relacwn con osciladores armónicos cuánticos y la energía interna se ha calculado determinando el número de osciladores que hay en promedio en cada estado energético permisible. Si las vibraciones de la red se pueden tratar de este modo, entonces deben existir cuantos de energía vibratoria emitidos o absorbidos cuando ocurran transiciones entre un estado cuántico y otro. Uno de los resultados de la mecánica cuántica del oscilador armónico es que, a una aproximación de primer orden, las transiciones ocurren sólo entre estados adyacentes del sistema;9 en otras palabras, en tales transiciones, el número cuántico del oscilador puede cambiar sólo por ± l. De acuerdo con esto, el cambio de energía ~E del oscilador correspondiente a la energía del cuanto que se absorbe o emite, debe ser ~e

= ~n · ñw = ± ñw

(6.4-1)

en donde w es la frecuencia del oscilador. El signo más de ( 6.4-1) se relaciona con la absorción y el signo menos con la emisión. Un cuanto de energía acústica de esta índole se denomina comúnmente fonón, para guardar cierta analogía con el término fotón usado para un cuanto de energía electromagnética. Un fonón se parece al fotón en que se debe considerar como algo que tiene características tanto de onda como de partícula; de hecho, es muy posible tratar la interacción entre dos fonones o entre un fonón y un electrón, como una "colisión" de dispersión entre dos partículas. En efecto, el resultado de Debye para el calor específico se puede obtener considerando las vibraciones reticulares del cristal como un gas de fonones. Puesto que los fonones son partículas no distinguibles, se debe utilizar la función de distribución Bose-Einstein para describir la distribución de partículas entre los estados energéticos del sistema y, dado que el número de fonones del sistema no es constante con respecto a la temperatura, la forma que toma la función de distribución es (5.6-9), en donde a= O. El número de fonones en el rango de frecuencias dw, alrededor de w (correspondiente a un rango de energía dE alrededor de E= hw) es, entonces, N(w) dw = g(w) dw ehw/kT _ 1

(6.4-2)

en donde g( w) dw es el núm~:ro de vibraciones normales posibles del sistema dentro del rango dw alrededor de w. No obstante, en (6.3-2) y (6.3-7), ya se sabe que dk

3k 2 V dk

g(w) dw = g(k) -d dw = -.2 -d dw. w

w

2n

(6.4-3)

Utilizando la aproximación de De by e ( 6.3-8) para expresar k y dk/dw en función de w (6.4-2) se convierte en N(w) dw

3V = -----z-3

2n v0 e

w 2 dw hwfkT

- 1



(6.4-4)

9 Para una derivación de esta regla de selección véase R. B. Leighton, Principies of Modem Physics, McGraw-Hill Book Co., Inc., Nueva York (1959), páginas 211-222.

Expansión térmica de los sólidos

193

El aumento de la energía interna correspondiente al rango de frecuencias dw alrededor de w es, simplemente, la energía cuántica hw multiplicada por el número de cuantos que haya en ese rango de frecuencias. Por tanto, dU = e(w)N(w) dw = hwN(w) dw 3/iV

=

w 3 dw

21t2V~ eAw/kT _



(6.4-5)

Al integrar sobre todas las frecuencias permisibles desde cero hasta la frecuencia máxima de Debye Wm, se obtiene directamente el resultado (6.3-11). Por supuesto, el término de energía de punto cero no se obtiene cuando la energía interna se calcula en esta forma, ya que la energía de punto cero no está relacionada de ningún modo con la distribución de los fonones. Sin embargo, este término no modifica el calor específico y los dos métodos conducen al mismo valor (6.3-16) del calor específico; dicho resultado es de interés físico y accesible a la medición. En consecuencia, el sistema se puede tratar como un conjunto de osciladores armónicos distinguibles que obedecen a la estadística de Maxwell-Boltzmann o bien, como un gas de fonones o cuantos de energía vibratoria, que no son distinguibles, y que obedecen a la estadística de Base-Einstein.

6.5

EXPANSI ON TERMICA DE LOS SOLIDOS

La representación de un sólido como sistema de átomos que tienen la libertad para vibrar alrededor de un arreglo periódico de posiciones de equilibrio, desarrollado en las secciones anteriores, basta para explicar el comportamiento observado del calor específico y, también, es suficiente para entender la expansión térmica de los sólidos. No obstante, en este caso se encuentra que si los átomos del cristal son simples osciladores armónicos ideales, no puede haber una expansión térmica en absoluto, de acuerdo con el pensamiento de la mecánica clásica ni la cuántica, y que el efecto total de la expansión térmica de un cristal real depende de la inarmonía de las vibraciones de la red. Este resultado se puede comprender cualitativamente considerando la energía potencial de interacción entre átomos cercanos, que debe tener la forma de una función de la distancia interatómica, como se ilustra en la figura 6.5. El mínimo en la curva de energía potencial, en B, es la posición clásica de equilibrio del átomo en cuestión cuando está en reposo. Si las fuerzas interatómicas fueran tales que el átomo al activarlo por excitación térmica vibrará alrededor de su posición de equilibrio, como un oscilador armónico clásico ideal, entonces la curva potencial sería una parábola perfecta cuyo vértice se ubicaría en B. En un ''pozo'' de potencial de esta naturaleza, el átomo ejecutaría vibraciones armónicas alrededor del punto de equilibrio B, las excursiones máximas a partir de dicho punto de equilibrio en ambas direcciones serían iguales, y la distancia interatómica promedio (x} sería igual a la .::onstante de red a temperatura cero, a. Así pues, no habría ninguna expansión térmica en absoluto. Sin embargo, en realidad, el cristal se desintegra al aplicarle una cantidad finita de energía y, por tanto, el pozo potencial en el que vibran los átomos debe tener .1proximadamente la apariencia que se ilustra en la figura 6.5. En este caso, aunque es casi parabólico alrededor del punto mínimo B, el verdadero pozo se desvía cada

194

Vibraciones reticulares y propiedades térmicas de los cristales

t• 1-- Pozo

¡

P.arabólico que corresponde al OSCilador ideal armónico

~O~l¡---:~----t-----=:==~~~==~--- X Energfa potencial del átomo Niveles cuanticos permitidos del oscilador inarmónico

Figura 6.5. Representación de la energía potencial de un solo atomo del cristal en tunción del espaciamiento interatómico, ilustrando el papel de la componente inarmónica en la expansión térmica.

vez más de la forma parabólica conforme aumenta 1a distancia que lo separa del punto mínimo. Si el átomo tiene una energía e0 , como debe ser, de acuerdo con el cuadro clásico, deberá vibrar entre los límites de amplitud extrema A y C, siendo las vibraciones de naturaleza más bien inarmónica. No obstante, la distancia DC entre la posición de equilibrio y la posición de máxima extensión es ahora mayor que la distancia AD entre la postción de equilibrio y la posición de máxima compresión. La distancia interatómica promedio <x> es, por tanto, mayor que la constante de red a temperatura cero y se observa una expansión térmica. Se puede demostrar que esta observación clásica del efecto lleva a la conclusión de que la expansión térmica <x>- a es directamente proporcional a la temperatura o que el coeficiente de expansión térmica d(<x>- a)/dT es independiente de la temperatura. Esto concuerda bastante bien con lo observado en la mayoría de las substancias, en el rango de temperatura ambiente o un poco por encima de ella. No obstante, a temperaturas bajas, el coeficiente de expansión térmica observado en la mayoría de los materiales se hace mucho más pequeño que el valor clásico y, en efecto, tiende a cero conforme la temperatura absoluta se acerca a cero. También aquí la representación clásica se hace inaplicable y los átomos del cristal deben considerarse como osciladores cuánticos y no como clásicos. Para calcular la expansión térmica, primero se debe resolver la ecuación de Schrodinger utilizando un potencial inarmónico (por lo general basta con modificar el potencial armónico (4.12-6) mediante la adición de un término cúbico en x) para obtener los niveles energéticos En y las funciones de onda correspondientes a este potencial modificado y, a continuación, se debe encontrar el valor esperado <x>n para cada estado energético permisible según (4.8-11). Entonces, la distancia interatómica, promediada sobre una distribución de Maxwell-Boltzmann, debe escribirse (en analogía con (6.2-1)) como

L (x).e-•nlkT (x)

= • Le •

tn/kT

(6.5-1)

Conductividad térmica reticular de los sólidos

195

en donde la suma se toma sobre todos los niveles de un oscilador inarmónico. Los detalles de este procedimiento son muy complejos y no se presentarán aquí. El coeficiente de expansión térmica calculado mediante este método se acerca a cero y concuerda aceptablemente con los experimentos sobre un amplio rango de temperaturas.

6.6

CONDUCTIVIDAD TERMICA RETICULAR DE LOS SOLIDOS

La conducción de calor en los sólidos es un proceso en el que las vibraciones de red desempeñan también un papel importante. En los cristales metálicos en los que se tienen grandes concentraciones de electrones libres, éstos hacen aumentar notablemente la conductividad térmica y, en efecto, constituyen el mecanismo principal para el transporte de energía térmica a través del cristal. El estudio de la conductividad térmica electrónica en los metales se facilita realizándolo a la luz de la teoría del electrón libre de los metales y, por tanto, se pospondrá hasta un capítulo posterior. Sin embargo, en substancias no metálicas, el transporte de calor a través del cristal se debe exclusivamente a las vibraciones de la red. La conductividad térmica se define generalmente como una situación de flujo térmico unidimensional, en la que hay una diferencia de temperatura t:1l' sobre una distancia &, originando un flujo de calor /Y), en una superficie A dentro de un tiempo !:J.t. La conductividad térmica es el coeficiente de proporcionalidad entre el flujo de calor por unidad de área y el gradiente de temperatura. De acuerdo con esta definición, se puede escribir J

qx

1 AQ AT =--=-KA At Ax'

(6.6-1)

en donde K es el coeficiente de conductividad térmica y Jqx el flujo de calor por unidad de área o la densidad de corriente térmica. El signo menos es obligatorio, ya que K se considera como una cantidad positiva; pues, con un gradiente de temperatura positivo se obtendría una corriente térmica negativa. Si se conserva la energía térmica, la corriente térmica debe obedecer siempre a la ecuación de continuidad de la forma V·J

q

aQ =oTq" ax- = - -ot.

(6.6-2)

Si se combinan (6.6-2) y (6.6-l), se puede ver fácilmente que la temperatura (y, por ende, la energía térmica por átomo) debe obedecer a una ecuación diferencial de la forma

K o2 T ~

oT

ox 2 =a¡·

(6.6-3)

. Esta ecuación diferencial parcial es esencialmente la misma que la ecuación que

de~cnbe el tra~sporte por difusión de partículas móviles en un medio en el que ex1~te .un gradiente de concentración. Difiere de la ecuación para la propagación

radiactiva (3.1-12) en que el lado derecho es la primera derivada con respecto al tiempo Y no la segunda derivada. Sus soluciones características tienen un comporta-

196

Vibraciones reticulares y propiedades térmicos de los cristales

miento exponencial en lugar de armónico con respecto al tiempo, como se verá más adelante en un capítulo posterior. En un sistema compuesto de osciladores armónicos ideales, los diversos modos normales de oscilación del sistema son completamente independientes los unos de otros, no existiendo en absoluto ningún acoplamiento entre los diferentes modos normales de vibración. Si se excita un modo normal dado de dicho sistema, éste vibrará en forma estable en ese mismo modo normal durante un periodo indefinido. En un sistema de este tipo, la energía de vibración se propaga directamente por radiación acústica en lugar de hacerlo por un proceso mucho más lento que se asocia con la conducción térmica. Así pues, la energía fluye a través del sistema con la velocidad del sonido, y no existe un mecanismo mediante el cual se pueda hacer aleatoria esta energía y mediante el cual se crea una resistencia térmica, de modo que la conductividad térmica del espécimen es esencialmente infinita. Estas observaciones son aplicables a los osciladores cuánticos al igual que a los osciladores clásicos. Este estado de cosas se puede describir en función de los fonones mediante la proposición de que los fonones correspondientes a diferentes vibraciones armónicas de modo normal no interactúan entre sí en absoluto -o que su sección transversal de interacciones mutuas es cero. Si se introduce una pequeña inarmonía en dicho sistema, se produce un acoplamiento entre los diversos modos normales. En este caso, si en un principio se excita un solo modo normal, la energía que inicialmente pertenece a este modo se transferirá gradualmente a otros modos normales que pueda tener el sistema y, así. quedará aleatorizada. En el lenguaje de los fonones, se puede decir que los fonones que representan las diferentes vibraciones de modo normal del sistema, interactúan (o chocan) unos con otros. En otras palabras, un grupo de fonones correspondientes a un solo modo normal del sistema armónico interactúan (o dispersarán unos a otros) de tal forma que, después de cierto tiempo, las cantidades de movimiento de cada fonón y sus direcciones de propagación cambiarán de una manera esencialmente aleatoria. La distribución de los fonones se convierte así, en una distribución que representa una selección más o menos aleatoria de los modos normales del sistema. dentro de las restricciones impuestas por la conservación de energía y la cantidad de movimiento en las interacciones individuales. De acuerdo con esto, es evidente que la conductividad térmica sería infinita. de no ser por la inarmonía de las vibraciones de red. La fuerza de la componente de inarmonía del potencial interatómico es, por tanto, un factor primordial en la determinación de la conductividad térmica. Puesto que la magnitud de la inarmonía aumenta de acuerdo con la amplitud de vibración, es de esperarse que la conductividad térmica disminuya conforme se incrementa esta amplitud, llegando a una reducción de la conductividad térmica de la red al aumentar la temperatura. Este efecto se observa de un modo muy general en los experimentos efectuados a temperaturas lo suficientemente elevadas. Una medición inversa de la fuerza de la interacción inarmónica entre los átomos de cristal, está dada por la distancia promedio que un fonón puede recorrer entre las colisiones aleatorizadoras o fenómenos de dispersión en que intervienen otros fonones. Esta distancia se conoce como la trayectoria libre media para las interacciones fonón-fonón y la conductividad térmica de los sólidos se puede entender con mayor facilidad sobre una base cualitativa en términos de la trayectoria libre media. En secciones posteriores se tendrá la ocasión de analizar la trayectoria libre media de un modo más preciso y en una forma cuantitativa. La conductividad térmica de los sólidos se comprenderá con mayor claridad considerando al cristal como un recipiente que encierra un "gas" de fonones. Primero se desarrollará una fórmula para la conductividad térmica de un gas monoatómico ideal y luego se examinará cómo se puede aplicar a la red de un sólido cristalino En primer lugar, se debe definir el número de partículas de un gas ideal

Conductividad térmica reticular de los sólidos

197

que tienen una velocidad en el rango de dv alrededor de v, que cruzan un elemento de área dS por unidad de tiempo, desde una dirección que queda dentro del rango angular d(J alrededor del ángulo polar fJ. Esta cantidad es la mitad del número dentro del rango de velocidad en el interior de una columna cuya sección transversal es dS cos (J (que es la proyección del área dS sobre un plano normal a la dirección fJ) que queda a una distancia de v centímetros del elemento de área propiamente dicho. Esta situación se ilustra en la figura 6.6. El factor un medio se incluye porque, en promedio, sólo la mitad de las partículas dentro de la columna que va a lo largo de la dirección (J, están encaminadas hacia el elemento de área, y el resto va en dirección opuesta. Si n(v) dv es el número de partículas por unidad de volumen que tienen la velocidad dentro del rango v alrededor de v, entonces, el número que cruza el elemento de área es

dn = fv · n(v) dv ·

4n sen 9 d(J • dS cos 9 = fvn(v) sen(} cos (} dv d(J dS. 41t

(6.6-4)

El factor asociado con sen (J anterior representa la relación del ángulo sólido subtendido por d(J alrededor de O y e1 ángulo sólido 41T subtendido por todo el espacio; es evidente que ese factor debe aparecer también en la expresión. Si se integra sobre v utilizando la distribución Maxwell-Boltzmann (5.4-14) (y recordando que la distribución de velocidad es independiente de fJ), se obtiene

n(9) d(J = con

fnc sen 9 cos (} d(J dS

(6.6-5)

e dada

por (5.4-20), como el resultado deseado. En este punto conviene hacer notar que el problema de la conducción térmica siempre implica un flujo de energía y un gradiente de temperatura, es decir que el sistema en cuestión nunca se encuentra en un estado de equilibrio térmico. Por esta razón, no es estrictamente correcto utilizar las funciones de distribución estadística que se aplican a sistemas en equilibrio. Sin embargo, si el gradiente de temperatura del sistema es tan pequeño que la variación fracciona! de la temperatura absoluta sobre una trayectoria libre media es reducida, se justifica el uso de la distribución en equilibrio como una aproximación. En todo caso, el problema se limitará aquí al estudio de sistemas de esta naturaleza. La cuestión del uso de distribuciones estadísticas en sistemas que no están en equilibrio, se examina en el siguiente capítulo.

FJgUra 6.6.

Geometría de partículas que fluyen a través de un plano, usadas en el cálculo de la sección 6.6.

198

Vibraciones reticulores y propiedades térmicas de los cristales

Por lo pronto, considérese la situación Ilustrada en la figura 6. 7. Se supone que existe un gradiente de temperatura a lo largo del eje x, de tal manera que las partículas en el origen tienen una energía promedio e y las que se encuentran a una corta distancia hacia la izquierda tienen la energía promedio e+ &. Supóngase que una partícula principia a una distancia 1 del origen y cede su energía a la distribu· ción en el origen, en una colisión que se produce en ese lugar. De acuerdo con la expansión de Taylor, la energía de esta partícula es (6.6-6)

Por supuesto, para esta partícula se tendrá otra que va en dirección opuesta y que transporta e energía desde el origen hasta el punto inicial de la primera partícula. El transporte neto de energía es & = (1 cose) (3ef3x ), y, puesto que el valor promedio de 1 es simplemente la trayectoria libre media entre las colisiones aleatorias, que se denominará X, el transporte neto de energía por partícula, promediada sobre la distribución de las longitudes de trayectoria 1, es

oe

e = (A. cos 8) ox.

(6.6-7)

Para partículas con un ángulo polar e, de acuerdo con ( 6.6-5) y ( 6.6-7), se produce un flujo neto de energía !lF por unidad de área, en donde

!l.F =

!l.e · n(O) dO 1 oe = - ncA.- cos 2 Osen O dO dS 2 ox .

(6.6-8)

Al integrar sobre el ángulo polar e entre los límites de O y 1r se puede ver fácilmente que el flujo total de energía debe ser -tncX (3e/3x). No obstante, de acuerdo con la definición de la conductividad térmica, K (6.6-l), esto debe ser igual también a K (3Tj3x). De acuerdo con esto,

oT 1 oe 1 oe oT K - =-nCA.- =-nCA.- - , ax 3 ax 3 ar ax

• +Ó•

Figura 6.7.

(6.6-9)



Trayectoria de una partícula en un sistema que contiene un gradiente de temperatura en la dirección x.

Conductividad térmica reticular de los sólidos

199

por lo cual, K

1 ae 1 = -3 ncA. -ar = -3 euA.c•

(6.6-10)

de donde, por definición, el calor específico cv es n(oe/31). Este resultado, que se acaba de derivar para un gas ideal de Maxwell-Boltzmann, es aplicable también a una distribución de fonones, a condición de que se sobreentienda que la velocidad e se refiere a una velocidad promedio de fonón, esto es, a una velocidad promedio de sonido dentro del cristal. [Se recordará que la distribución de Boltzmann se utilizó sólo para velocidades promedio al obtener (6.6-5).] Entonces, de acuerdo con (6.6-10), el problema de determinar la conductividad térmica de red se puede reducir esencialmente a la determinación de la trayectoria libre media de los fonones en el cristal, ya que la velocidad del sonido y el calor específico se pueden medir o calcular con facilidad. Desgraciadamente este problema no es tan sencillo. Reproducir el trabajo comprendido en su cálculo queda más allá del alcance de este libro. Peierls,l 0 fue el primero en resolver este problema, y encontró que X es proporcional a 1/T a temperaturas elevadas y a eE>/lT a temperaturas bajas. De acuerdo con esto, la conductividad térmica se deberá hacer infmitamente grande conforme la temperatura se acerca al cero absoluto, ya que el producto de Cv y X divergirá al infmito en este límite. Sin embargo, en realidad, a temperaturas muy bajas la trayectoria libre del fonón deja de estar limitada por las interacciones fonón-fonón y se ve limitada, por el contrario, por la dispersión de fonones mediante impurezas e imperfecciones en el cristal o bien, en cristales muy puros, por las superficies de la misma muestra de cristal. ¡En este último caso, se ha encontrado que la conductividad térmica del cristal es una función del tamaño de la muestra! En cualquier caso, la trayectoria libre media tiende a un límite finito conforme T se acerca a cero, y la conductividad se acerca a cero conforme T tiende a cero, debido al hecho de que Cv se desvanece en el límite de la temperatura cero. Entonces, al incrementarse la temperatura la conductividad térmica aumenta de cero a cierto valor máximo y luego disminuye conforme la temperatura se incrementa más todavía. Este comportamiento cualitativo se ha observado, efectivamente, de un modo experimental en la mayoría de los casos y las magnitudes de los valores calculados ( 6.6-1 O) a partir de los valores calculados de X, concuerdan con los datos experimentales en el orden de magnitud. Casimir 11 fue el primero en estudiar el efecto de la dispersación a través de las fronteras del cristal, y Klemens 12 fue quien trató detalladamente el efecto de ciertos tipos de imperfecciones. EJERCICIOS l. Demuestre de un modo explícito, utilizando la estadística de Maxweli-Boltzmann, que la energía promedio de un oscilador armónico clásico tridimensional es sencillamente tres veces la de un oscilador armónico clási.::o unidimensional a la misma temperatura y que, por tanto, no unporta si el cristal de N átomos se considera como un conjunto de N osciladores tridimensionales o bien, como 3N osciladores unidimensionales. 2. Calcule, por el método de Debye, la capacidad calorífica de una red cristalina periódica bidimensional que contiene N átomos idénticos, y demuestre que a temperaturas bajas, la capacidad calorífica varía con la temperatura como 'J'2. ¿Cuál es el límite en alta temperatura para la capacidad térmica?

lO 11 12

R. Peierls, Ann. Physik 3, 1055 (1929). H. B. G. Casimir, Physica 5, 495 (1938). P. G. Klemens, Proc. Roy. Soc. A208, 108 (1951).

200

Vibraciones reticulares y propiedades térmicas de los cristales

3. Calcule la temperatura de Debye 8 para (a) diamante, (b) germanio, (e) cobre y (d) plomo, y compare sus resultados con Jos valores publicados derivados de los datos experimentales de la capacidad térmica. 4. Utilice la relación de Planck para expresar la energía de un fonón en relación con su frecuencia y la relación de De Broglie para expresar la cantidad de movimiento en función del número de onda; encuentre una expresión para la "masa" equivalente de un fonón de energía térmica promedio a 300° K, y compare este valor con la masa electrónica. Puede suponer que k es tan pequeña que se puede hacer caso omiso de Jos efectos de dispersión. S. Demuestre que el valor promedio <x>n de la amplitud de un oscilador armónico cuántico, en el nésimo estado de energía, es cero. 6. Utilice las leyes de la termodinámica para demostrar que la difer~::ncia entre el calor específico de una substancia a presión constante y a volumen constante está dada por

9oc 2 VT

Cp-Cu = - - -

K~oo

en donde a es el coeficiente lineal de expansión y Kiso es la compresibilidad isotérmica - V-1 Nota: Observe que, de acuerdo con las relaciones de Maxwell (os/aP)r=-(av¡aT)p. 7. Sea un conjunto de N sistemas idénticos que tienen sólo dos niveles de energía, a las energías cero y € 0 . Suponiendo que los sistemas son distinguibles, encuentre (a) la energía interna del conjunto, (b) la capacidad térmica, (e) las expresiones aproximadas para la capacidad térmica en los límites de temperatura alta y baja. Grafique la capacidad térmica en función de la temperatura. 8. Para el conjunto de sistemas que se vio en relación con el ejercicio 7, demuestre que la capacidad térmica alcanza un valor máximo a una tt.>mperatura T 0 para la que

(iW/aP>r·

xtanhx=l en donde x =e0 /2kT. Demuestre también que la capacidad térmica a esta temperatura está dada por

c. (max) = Nk (x~ - 1) en donde X o = e0 /2kT0 • Las contribuciones a la capacidad térmica de sistemas de esta naturaleza, se encuentran con frecuencia a temperaturas bajas en substancias paramagnéticas y se conocen también con el nombre de anomalías de Schottky. 9. De acuerdo con la expresión de la mecánicd cuántica e=<1 +nx +ny +nz)hvo (en donde nx, nY. y nz pueden ser cero o enteros positivos) para los niveles de energía de un oscilador armónico tridimensional, demuestre, en el límite de las energías grandes en donde e>% y de:lil>%, que el número de estados cuánticos dentro de un rango de alrededor de la energía e, está dado por g(e) de= e2de/2(flwo) 3 • 10. Utilice el resultado del problema 9 para demostrar que la expresión (e)= 3kT para la energía promedio de un oscilador armónico clásico tridimensional de un sistema cuyos miembros están distribuidos en energía de acuerdo con la ley de Boltzmann, se puede obtener sencillamente evaluando la expresión

fef(e)g(e) de (e) =

Jt(e)g(e) de Compare críticamente los aspectos físicos de este método y el que se utilizó para obtener el mismo resultado en la sección 6.1.

REFERENCIAS GENERALES P. G. Klemt'ns, Thermal Conductivity and Lattice Vibrational Modes, en Salid State Physics, Advances in Research and Applications, Vol. 7, Academic Press, Nueva York (1959), pp. l-98.

Conductividad térmica reticular de los sólidos

201

1. de Lannay, The Theory of Specific Heats and Lattice Vibrations, en Salid State Physics,

Advances in Research and Applications, Vol. 2, Academic Press, Nueva York (1956), pp. 219-303. LB. Leighton, Principies of Modern Physics, McGraw-Hill Book Co., Inc., Nueva York (1959), capítulo 6. 1l. B. Peierls, Quantum Theory o[ Solids, Clarendon Press, Oxford (1955), capítulo 11. f Seitz, Modern Theory of Solids, McGraw-Hill Book Co., Inc., Nueva York (1940), capítulo Ill.

CAPITULO

7

Teoría del electrón libre de los metales 7.1

INTRODUCCION

En 1900, Drude 1 fue el primero en formular la hipótesis de que la gran conductividad eléctrica y térmica de las substancias metálicas podría explicarse debido a la presencia de grandes concentraciones de electrones libres móviles en estos materiales. Más tarde, Lorentz 2 investigó exhaustivamente las implicaciones de esta idea. Drude y Lorentz supusieron que los electrones libres de un metal podían considerarse como un gas ideal de partículas libres, el cual obedece a la estadística de Maxwell-Boltzmann, cuando se encuentra en equilibrio térmico. Para examinar lo que puede suceder cuando se permite el flujo de corrientes eléctricas o térmicas, estableciéndose así un estado de desequilibrio, fue necesario investigar cómo se modificaría la distribución de equilibrio mediante una (pequeña) corriente eléctrica o térmica. También fue necesario estudiar el comportamiento cinético de los electrones como el de partículas libres sujetas a colisiones instantáneas que sirven para volver la distribución a una condición de equilibrio, y para expresar el resultado final de la conductividad eléctrica y térmica en términos de una trayectoria libre media o tiempo libre medio entre estos choques aleatorios. La teoría Drude-Lorentz explicó satisfactoriamente la ley experimental bien conocida de Wiedemann y Franz, 3 según la cual la relación existente de la conductividad eléctrica a la térmica es casi la misma para la mayoría de los metales. Además, para calcular las magnitudes de la conductividad eléctrica y térmica se podrían utilizar los valores más elevados para la trayectoria libre media. Sin embargo, la teoría del electrón libre en su forma más sencilla llevó a una predicción de la componente electrónica del calor específico que (suponiendo que la teoría de Debye para el componente reticular esté en lo correcto) estaba en gran desacuerdo con los resultados experimentales. Sommerfeld4 resolvió esta dificultad Uunto con algunas otras) utilizando la estadística de Fermi-Dirac en lugar de emplear la estadística clásica de Boltzmann. La representación del electrón libre empleando la estadística de Fermi-Dirac constituye una forma teórica muy directa y sencilla de analizar y entrever los efectos de transporte en los metales. Puesto que principia con una idea preconcebida del aspecto de un metal, no tiene ningún valor para explicar 1 2 3 4

P. Drude, Ann. Physik 1, 566 (1900). H. A. Lorentz, The Theory of Electrons, Teubner Verlag, Leipzig (1909). Wiedemann y Franz, Ann. Physik 89, 497 (1853). A. SommerfeJd, Z. Physik, 47, 1 (1928).

203

204

Teoría del electrón libre de los metales

por qué algunas substancias son metales y tienen electrones libres en abundancia y otros son aisladores con sólo unos cuantos electrones libres, si es que los tienen. Para encontrar una explicación a estas cuestiones fundamentales, es necesario comenzar examinando el comportamiento mecánico cuántico de los electrones en los campos periódicos de potencial, examinando el mismo tema en un nivel mucho más fundamental. El último planteamiento se pospondrá hasta el siguiente capítulo, en el que se demostrará que las propiedades de los metales y los aisladores se pueden comprender de acuerdo con la teoría cuántica, y que las bases en las que descansa la teoría del electrón libre son, en su mayor parte, compatibles con los requisitos de la mecánica cuántica.

7.2

LA ECUACION DE BOLTZMANN Y LA TRAYECTORIA LIBRE MEDIA

En cualquier problema de mecánica estadística, lo más importante es conocer la forma de la función de distribución. Por supuesto, en un sistema de equilibrio térmico, la función de distribución será una de las que ya se estudiaron en el capítulo 5, pero si el estado del sistema no es de equilibrio (por ejemplo, si fluye una corriente o hay un gradiente de temperatura), la función de distribución será algo distinta. Naturalmente, en el límite en que desaparece la perturbación de la condición de equilibrio, la función de distribución de desequilibrio debe aproximarse a la distribución de equilibrio apropiada. Entonces, para cualquier estudio estadístico de procesos en desequilibrio debe darse un paso preliminar que consiste en la determinación de una forma para evaluar la función de distribución cuando el sistema se encuentra en un estado de desequilibrio. Esto se logra mediante la ecuación de Boltzmann. Para deducir esta ecuación, debe considerarse una región de espacio de fase alrededor del punto (x,y,z,px,Py.Pz). El número de partículas que entra en esta región en el tiempo dt, es igual al número de las que estaban en la región del espacio de fase en (x- Vxdt, y - Vydt, z - Vzdt, Px - Fxdt, Py - Fydt, Pz - Fzdt) en un tiempo anterior dt. En este caso, F representa la fuerza que actúa sobre las partículas de la distribución en el punto (x, y, z) y el tiempo t, y se sigue de la ley de Newton, F = dpfdt. Si f(x, y, z, Px• Pv• Pz) es la función de distribución que expresa el número de partículas por estado cuántico en la región, entonces, habrá un cambio df que ocurre durante el tiempo dt, debido al movimiento de las partículas en el espacio de las coordenadas y debido a que los campos de fuerza que actúan sobre las partículas tienden a moverlas de una región a otra en el espacio de la cantidad de movimiento; este cambio df es df = f(x- v"dt, y- v,dt, z - v.dt, Px- F"dt, p1

-

F,dt, Pz- F.dt) - f(x,y,z,p",p,,p.).

(7.2-1)

Utilizando la expansión de Taylor y manteniendo sólo los términos de primer orden dentro del límite dt ~O, esta expresión se puede escribir como sigue

La ecuación de Boltzmann y la trayectoria libre media

205

o bien, df = -v · dt

-

vrF ·V J

(7.2-2)

f

p '

en donde el símbolo VP se refiere al operador del gradiente en el espacio de cantidad de movimiento (px, Py. Pz). Hasta ahora sólo se ha explicado el cambio en la función de distribución debido al movimiento de las partículas en el espacio de las coordenadas y debido a los cambios en la cantidad de movimiento originados por los campos de fuerza que actúan sobre las partículas. Las partículas también se pueden ~ransferir hacia dentro o hacia afuera de una región dada del espacio de fase, por medio de colisiones o interacciones de dispersión que abarcan otras partículas de la distribución o centros de dispersión externos al conjunto de partículas que se están estudiando. Si la velocidad de cambio de la función de distribución debida a las colisiones o a la dispersión se representa mediante (a¡;at) col• entonces, la velocidad total de cambio de f se puede obtener sumando esta cantidad al lado derecho de (7.2-2), lo cual da

# = -v•Vf-F·VPJ+ dt

(~) at

(7.2-3) col

Esta es la ecuacton de Boltzmann. Si se conoce el campo de fuerza F y la velocidad de cambio (a¡;at) col• de la ecuación diferencial (7.2-3), en principio, se puede despejar la función de distribución. Por supuesto, a fin de hacer esto se debe adoptar para la interacción de dispersión algún modelo que pueda proporcionar la velocidad a la que las partículas a consecuencia de colisiones pueden entrar en cualquier región dentro del espacio de fase a salir de ella. Por ejemplo, se pueden suponer condiciones de estado estacionario que indican que df/dt =O, y, además, especificar que no existen campos de fuerza que actúen sobre las partícula~ y que las partículas de la distribución son esferas duras, perfectamente elásticas y de un radio dado, que sufren colisiones que pueden tratarse mecánicamente de acuerdo con las leyes clásicas del movimiento, para obtener un valor promedio para (a¡;at) col· Este cálculo mecánico proporciona fundamentalmente una sección transversal de la dispersión de una partícula de la distribución. En este caso, se puede demostrar que la ecuación de Boltzmann lleva directamente a la distribución Maxwell-Boltzmann del capítulo 5. La ecuación de Boltzmann se usa más comúnmente para analizar las propie· dades de un sistema que se encuentra desplazado del estado de equilibrio debido a una fuerza perturbadora pequeña -por ejemplo, un campo eléctrico o un gradiente de temperatura- cuando se conoce la función de distribución / 0 , que es la función de distribución en equilibrio, cuando no hay perturbación. En estos casos, con frecuencia se supone que el término de la colisión tiene la forma

(-a¡) -_-f-- -Jo at

col

(7.2-4)

T

en donde T es un parámetro denominado tiempo de relajación o tiempo libre medio. L~ ecuación (7.2-4) representa la velocidad a la que la función de distribución se acerca a la condición de equilibrio (habiéndose eliminado repentinamente la fuerza de perturbación), siendo proporcional en cualquier tiempo a la desviación, desde el equilibrio.

206

Teoría del electrón libre de los metales

Por ejemplo, suponga que un campo eléctrico E0 ongma una corriente en un circuito que se compone de una substancia metálica uniforme, de tal modo que f es la misma en todos los puntos y, por ende, Vf = O. Mientras el campo se aplica, la fuerza F de (7.2-3) debe representarse como -eE0 ; pero si el campo se suprime de un modo repentino, por ejemplo, cuando t =O, entonces, para valores positivos de t, F = O, y la ecuación de Boltzmann, utilizando la aproximación del tiempo de relajación (7.2-4), se convierte en

f-fo

=---

(t >O)

(7.2-5)

que se puede resolver fácilmente y se obtiene

f- fo

= (const.)e-'1'

(t > 0).

(7.2-6)

Así es como la función de distribución se aproxima exponencialmente junto con la constante de tiempo 7, a la función de distribución en equilibrio y se descubrirá que la corriente del circuito disminuye de su valor inicial esencialmente en la misma forma, tendiendo a cero exponencialmente con la constante de tiempo 7. A primera vista, este resultado parece contradecir la evidencia experimental; pero en realidad no se opone a ella, ya que la constante de decaimiento 7 en circunstancias ordinarias, es muy corta, casi siempre del orden de 1o- 13 segundos. Un estudio más cuidadoso puede ayudar a verificar la factibilidad de (7.2-6), ya que la acción del campo eléctrico es darle a los electrones del circuito una velocidad de arrastre en dirección opuesta a la corriente que, de acuerdo con la ley de la inercia, debe persistir durante un corto tiempo después de la supresión de la fuerza, hasta que los electrones del conductor pasen los procesos que aleatorizan su velocidad reduciendo la velocidad promedio de arrastre a cero. Es evidente que las colisiones ejercen influencia en una distribución que es perturbada de un modo u otro, pero tiende a restaurarse al estadd de equilibrio y, si dicha perturbación se suprime, esta restauración se logra en un tiempo del orden del tiempo de relajación 7. Los detalles del proceso de dispersión determinan el tiempo de relajación que, en general, es una función de la energía, debido a que la sección transversal de la dispe1sión puede depender de la energía. Este efecto de restricción de las colisiones es esencial para determinar la ley que relaciona la densidad de corriente con el campo eléctrico en un conductor ordinario. Si un sistema que contiene electrones perfectamente libres recibe la influencia de un campo eléctrico constante, sin que hayan colisiones, los electrones sometidos a una fuerza constante adquieren una aceleración constante y, por tanto, una velocidad linealmente creciente. Por consiguiente con un campo dado, la densidad de corriente en un conductor largo sería mayor que en uno corto, ya que la velocidad promedio de los electrones principiando en repo'so en un extremo y fluyendo hacia el otro, sería mayor en la trayectoria más prolongada que en la más corta. Por supuesto, esto no es lo que sucede en absoluto. En realidad, un electrón que principia en reposo es acelerado por un campo y adquiere una velocidad de arrastre que aumenta linealmente durante un corto tiempo; pero a continuación sufre una colisión que (en promedio) reduce su velocidad de arrastre a cero y el proceso se repite. Durante un periodo dado, al electrón puede asignársele una velocidad de a"astre constante promedio, proporcional al campo e inversamente proporcional al tiempo de relajación. Esto lleva a la ley de Ohm, según la cual la densidad de corriente es proporcional a la fuerza del campo eléctrico. Se puede hacer una estimación aproximada de la conductividad basándose en esos datos. La fuerza ejercida

La ecuación de Boltzmann y la trayectoria libre media

207

sobre un electrón es -eE0 , en donde E 0 es el campo aplicado, por lo que la aceleración es -eE0 /m, siendo m la masa del electrón. Si la fuerza actúa durante el tiempo t, produce una velocidad de arrastre -eE0 t/m y si el tiempo promedio que hay entre las colisiones aleatorias es 7, la velocidad de arrastre promedio está dada por

_ eE0 r: V=---, 2m

(7.2-7)

suponiendo, por supuesto, que la velocidad de arrastre se ha reducido a cero en promedio de bido a una colisión. Si la densidad de electrones libres es n 0 , la densidad de corriente I será, por definición, (7.2-8)

en donde la conductividad se expresa mediante (7.2-9)

La ecuación (7.2-8) es, sencillamente, la ley de Ohm; este simple planteamiento en el que se hace caso omiso de los promedios, da un valor de 7 demasiado pequeño al multiplicarlo por 2, como se verá en breve. El hecho de considerar el tiempo de relajación 7 como el tiempo libre medio entre las colisiones aleatorias, se puede explicar si se analiza un grupo compuesto inicialmente de n 0 partículas, en el tiempo t = O, cada una de las cuales puede sufrir una colisión que aleatoriza por completo su velocidad con una probabilidad dt/7 en cualquier intervalo de tiempo dt. Suponga que en el tiempo t, quedan n(t) partículas que todavía no han tenido un choque. El número de partículas que chocan en un tiempo dt, con respecto a t es, en promedio, n(t'ylt/7, de modo que,

dn(t)

n(t)

-dt- = - 1:al integrarse (haciendo que n = n 0 a t

= 0),

(7.2-10)

da (7.2-11)

El número de partículas existentes en el grupo original decae exponencialmente, volviendo a la distribución de equilibrio de acuerdo con (7.2-11). Este es exactamente el comportamiento que predice la ecuación de Boltzmann en la aproximación del tiempo de relajación (7.2-6). Es más, la distribución de los tiempos libres, de acuerdo con (7.2-11), también es exponencial, en tal forma que el número de tiempos libres dn(t) en un intervalo dt con respecto a t es

no 1 dn(t) =-e-' • dt. 1:

(7.2-12)

208

Teoría del electrón libre de los metales El tiempo libre promedio se puede calcular del modo acostumbrado y esto da

t'"

f:

t dn(t)

Ia''" dn(t) =

J:

te-''' dt (7.2-13)

e-r!< dt =

T.

Entonces, se puede llegar a la conclusión de que la supostcwn de una probabilidad de colisión que es constante con el tiempo para una partícula dada, conduce al mismo resultado que la aproximación del tiempo de relajación en la ecuación de Boltzmann, y que el tiempo de relajación de esta ecuación es idéntico al tiempo libre medio que hay entre colisiones. En el desarrollo anterior se supuso que basta una sola colisión para hacer que la partícula vuelva a la distribución de equilibrio. Si no es así (por ejemplo, si se requieren varias colisiones para aleatorizar por completo la velocidad de una partícula), el tiempo de relajación se debe interpretar como algo que se refiere al tiempo requerido, en promedio, para que una partícula adquiera una velocidad totalmente aleatoria, a pesar de que ésta pueda ser muchas veces mayor que el tiempo medio real entre colisiones. En el estudio anterior se supuso que en el grupo inicial, todas las partículas tenían la misma energía. Si la sección transversal de las colisiones varía con la energía de la partícula incidente, como sucede a menudo, el tiempo de relajación será diferente para cada valor de energía de partícula, y T será una función de la energía. También es posible que el tiempo de relajación sea no isotrópico, variando con la dirección del vector de la cantidad de movimiento de la partícula. Sin embargo, este estudio se limitará solamente al caso isotrópico en el que T puede ser una función de la energía; pero no de la dirección. La trayectoria libre media existente entre colisiones se puede definir en la misma forma que el tiempo de relajación. Si la probabilidad para que una sola partícula sufra una colisión al atravesar una distancia dx es el valor constante dx(A, y si se tienen n(x) partículas de un grupo inicial en el que quedan n 0 después de haber recorrido una distancia x, el número de partículas que choca en un intervalo de trayectoria dx con respecto a x será n(x)dxj'll., por lo cual,

dn(x) dx

n(x) A.

--= --dx

(7.2-14)



Al igual que antes, esto lleva a (7.2-15)

Nuevamente, la distribución de longitudes de trayectoria dn(x) dentro de un intervalo dx alrededor de x es, pues,

dn(x) =no

e-x/A

dx

(7.2-16)

).

y la trayectoria libre media está dada por

_ X =

L"'xdn(x)

t"'

·---

---- =

dn(x)

f

,.,xe-x1Adx 0 . ---

L'"

e-x/A dx -

A .

(7.2-17)

Conductividad eléctrica de un gas de electrones libres

209

La cantidad A que, como se vio antes, es la recíproca de la probabilidad de .-:olisión por unidad de distancia, se denomina trayectoria libre media. La trayectoria libre media se define también en relación con un grupo de partículas que tienen, todas ellas, la misma energía inicial y que en general debe .-:onsiderarse como una función de la energía. En el caso de las interacciones elásticas mutuas que hay entre esferas duras o colisiones elásticas entre partículas esféricas rígidas y centros de dispersión fijos en forma de esferas duras, se puede ver fácilmente que la trayectoria libre media es una propiedad geométrica del sistema y, por ende, independiente de la energía. Se verá que la dispersión de electrones mediante fonones de modo acústico en metales y semiconductores, se puede aproximar a través de este modelo y, en consecuencia, se puede describir de acuerdo con una :rayectoria libre media independiente de la velocidad. Por supuesto, cualquier trayec:oria libre individual l y el tiempo libre correspondiente t están relacionados, por

l = vt,

(7.2-18)

ii.n embargo, la relación existente entre la trayectoria libre media A y el tiempo libre "'"edio T se deben obtener sacando el promedio de la distribución de velocidades y iependerá en detalle de la forma en que la trayectoria libre media y el tiempo de ~elajación dependan de la energía.

73

CONDUCTIVIDAD ELECTRICA DE UN GAS DE ELECTRONES LIBRES

Ahora se utilizará la ecuación de Boltzmann para predecir la conductividad liéctrica y térmica de un gas de electrones libres. En primer lugar se verá una substancia isotrópica uniforme a temperatura constante en una condición de estado estacionario bajo la influencia de un campo eléctrico constante aplicado E 0 • Puesto que el sistema se encuentra en un estado estacionario, df/dt =O y, dado que el material es uniforme y está a temperatura constante, la función de distribución debe ser la misma en todas las partes de la muestra, de donde, V/= O. En estas condiciones, la fuerza ejercida sobre un electrón es -eE0 y la ecuación de Boltzmann en la aproximación del tiempo de relajación se puede escribir como sigue, utilizando (7.2-3) y (7.2-4)

f-fo

eE0 • V,f= - - . 't

(7.3-1)

Si se escoge un sistema de coordenadas de tal modo que el eje z esté en la dirección E 0 , entonces, E0 sólo tiene una componente z y la ecuación anterior se puede expresar como sigue

eE0 -r



m

av,

--=f-fo·

(7.3-2)

En esta ecuación, se supone que la diferencia existente entre f y fo es muy pequeña, de modo que offozz se puede aproximar por medio de ofo/OVz. Si además se supone que la función de distribución fo, que describe el estado de equilibrio del sistema, es una distribución Maxwell-Boltzmann de la forma (5.4-15), entonces,

a¡o =

av,

- mv, fo·

kT

(7.3-3)

210

Teoría del electrón libre de los metales En estas condiciones, la ecuación de Boltzmann se convierte en

f = fo ( 1 -

eEo·r:vz) =Jo ( 1 ---¡:;¡-

0 -r eE ) k T v cos (} ,

(7.3-4)

dado que Vz = v cos {), en donde 8 es el ángulo que hay entre el eje polar z y la dirección v. Por definición, la densidad de la corriente eléctrica lz es

(7.3-5) y vz se puede expresar como

_f f

vzf(v)g(v)d 3 v

Vz =

(7.3-6)

f(v)g(v)d 3 v '

en donde g(v) es la densidad de estados por unidad de volumen del espacio de velocidad y d 3 v es el elemento de volumen apropiado en el espacio de la velocidad. La notación que se adoptará en esta obra y se utilizará sistemáticamente a partir de ahora, es que una cantidad con una barra encima, a:, se refiere a un promedio sobre la distribución real de desequilibrio, en tanto que una cantidad encerrada entre paréntesis, (a:), se relaciona con un promedio de dicha cantidad tomado sobre la función de distribución de equilibrio. La única excepción es la velocidad térmica que, para seguir esta convención, debería escribirse realmente como (v), pero que, de acuerdo con la convención tradicional, se conservará la notación C. Como se verá, es más conveniente integrar sobre coordenadas esféricas (v, 8, cp) en el espacio de velocidad y, por tanto, se debe utilizar el elemento de volumen d 3 v = v2 sen 8 dvd8dcp. Utilizando este elemento de volumen en combinación con la densidad de estados en el espacio de velocidad, según está dado por ( 5.4-1 7) y la función de distribución (7.3-4), y observando que Vz = v cos 8, (7.3-6) se puede expresar como

(7.3-7)

En (7.3-7), ya se realizó la integración sobre cp de O a 2rr. Puesto que los integrandos son independientes de e/>, los factores 2rr obtenidos en el numerador y el denominador se anulan. Así también, puesto que es cero (para la situación de equilibrio), la integral que incluye sólo / 0 en el numerador de (7.3-7) debe ser cero; es más, en el término dependiente del campo del denominador aparece una integral angular de cos 8 sen 8 =+sen 28 sobre el rango O< 8 < 7T y, por tanto, este término también se integra a cero. En consecuencia, la ecuación (7.3-7) se puede reducir a

(7.3-8)

Conductividad eléctrica de un gas de electrones libres

211

Las integrales angulares se pueden evaluar con facilidad, dando

_ Vz

=-

f f'"'

'"'v 2 t(v) · v2j 0 (v) dv eEo o 3kT

E

=-

e o 2 3kT (v t),

(7.3-9)

v%(v) dv

o

las integrales restantes representan sólo el promedio (v 2 r (v)> sobre la función de distribución de equilibrio. No obstante, en un gas de partículas libres de Boltzmann, la energía cinética promedio por partícula es 3kT/2, de tal manera que

de donde, (7.3-10)

Al substituir esto en (7.3-9), se puede escribir, finalmente, (7.3-11)

en donde, (7.3-12)

El resultado de este método más exacto concuerda con (7.2-7) que se obtuvo de un modo muy aproximado, excepto por un factor de 2 y por el hecho de que la cantidad 7, según la da (7.3-12) y (7.3-9) no es precisamente igual a r, excepto cuando r, es independiente de v. En este aspecto, es muy común defmir la movilidad de una partícula como la magnitud de la velocidad promedio de arrastre por unidad de campo. De acuerdo con (7.3-11), la movilidad ¡.¡. debe estar dada por

-1 1-

p.Vz- - ei. E0 m

(7.3-13)

La unidad de movilidad es la velocidad por unidad de campo que, en el sistema cgs-gaussiano es cm 2 volt- 1 seg- 1 • La densidad de corriente /z es, de acuerdo con (7.3-5) y (7.3-11),

(7.3-14)

por lo cual,

212

Teoría del electrón libre de los metales

Se debe observar que estos resultados también se pueden establecer de acuerdo con la movilidad, como sigue, (7.3-16)

de donde, (7.3-17)

u= nep.

Para evaluar a explícitamente en términos del tiempo de relajación r, es necesario especificar la dependencia de r con respecto a v. Entonces, si r es independiente de v, de acuerdo con (7.3-9) y (7.3-12), 7 = r. Para el caso en el que la trayectoria libre media es independiente de la velocidad, r = 'A/v y (7.3-12). (7.3-10) y (5.4-20) llevan a _

A.(v) (v2)

A.c 3kT/m

8 A.

'r=--=---=--

31t

e'

(7.3-18)

En la expoSicton anterior se supuso, al igual que Drude y Lorentz, que el gas electrónico se podía describir adecuadamente mediante la distribución de energía de Maxwell-Boltzmann. Por supuesto, los electrones obedecen en realidad al principio de exclusión de Pauli y, debido a ello, se tuvo que utilizar la función de distribución de Fermi-Dirac para que los resultados fueran perfectamente correctos. Si la distribución de equilibrio es la de Fermi-Dirac (5.5-20), se debe escribir, en lugar de (7.3-3), (7.3-19)

Al substituir este resultado en (7.3-2) suponiendo nuevamente que offovz se puede substituir mediante ofofovz, se tiene que eE0 -r f = fo - kT fo(l - fo)v cos O.

(7.3-20)

Al utilizar esta expresión como la función de distribución en (7.3-6) y observando que la integral incluida en el primer término de (7.3-20) en el numerador, y la integral relacionada con el segundo término de (7.3-20) en el denominador, de la expresión resultante se anulan igual que antes y, después de integrar sobre las coordenadas angulares, se llega a

(7.3-21)

En el caso general es imposible evaluar analíticamente estas integrales sobre la función de distribución de Fermi-Dirac; en cambio, es muy fácil obtener un resultado aproximado que es casi correcto para T 4.. TF, lo cual por supuesto, es lo que sucede casi siempre para la mayoría de los conductores metálicos en las condiciones que se encuentran en la práctica.

Conductividad eléctrica de un gas de electrones libres

213

Para lograr esto, es muy conveniente expresar las integrales de (7 .3-21) como integrales sobre la energía, y no la velocidad, por lo cual se obtiene

(7.3-22)

Se debe observar que para

T~TF

(es decir,

kT~e1),

la función de Fermi

f 0 (e) es muy pequeña para e, significativamente en exceso de e¡ y la función complementaria 1 - fo es muy pequeña para valores de e que son mucho menores que e1. Por tanto, la función producto [ 0 (1 - [ 0 ) es muy pequeña excepto en la cercanía de e = e1 , como se ilustra en la figura 7.l. Partiendo de (7 .3-19), es fácil demostrar analíticamente que [ 0 (1 - [ 0 ) es un máximo en e= e¡, en cuyo punto [ 0 (1 - [ 0 ) = y que la región sobre la que [ 0 (1 - [ 0 ) no es pequeña en comparación con su valor máximo, tiene una anchura del orden de kT. Por tanto, la integral del numerador de (7.3-22) no aumentará de manera significativa, excepto en donde e tiene valores no mayores de unas cuantas unidades kT de e1. Si e3 12 T(e) es una función que no cambia mucho en este rango de energías, se puede considerar que [ 0 (1 - [ 0 ) es esencialmente una función o de Dirac de e - e1 , y se puede escribir, 5

t

fo(e)(l - fo(e))

~ A!5(e- e1 )

(7.3-23)

en donde A es un factor de normalización que se debe escoger de tal modo que cuando (7.3-23) se integra sobre la energía, se obtiene el valor correcto de la integral del lado izquierdo.

., Figura 7.1.

Las funciones /o(€), 1 -!o y lo (1 - / 0 ) para un sistema de Fermi, graficadas en función de la energía. El factor de escala vertical de la curva fo (1 -/o) no es el mismo que el de las otras curvas.

Puesto que, mediante la integración directa (empleando la substitución u= (e- e¡)/kT) se puede demostrar que

Joo o

j 0 (1 -Jo) de

=kT

Joo

e"du ( + ") 2 -•1 tkT 1 e

kT

= 1+e

•¡tkT

~ kT

(7.3-24)

s Véase el apéndice A, donde hay una definición y una explicación de la función Dirac.

o- de

214

Teoría del electrón libre de los metales

y, puesto que la integral de la función 6 es la unidad, es evidente que se debe tomar A = kT en (7 .3-23), de donde, j 0 (e)(l - j 0 (e)) g;; kTb(e- e1)

(kT

~ e1 ).

(7.3-25)

Esto se substituye en (7.3-22) y se evalúa la integral del denominador de la ecuación, observando que fo(E) es la unidad para O< E< E¡ y cero para E> E¡, que es una buena aproximación de kT ~ E¡, obteniéndose

_ Vz

2eE0

f

00

e3 ' 2 -r(e)b(e - e1 ) de

0

(7.3-26)

= - _3_m_ !:.....:....._f'"":-~-el_/_2d_e_ __

La densidad de corriente lz =-nevz y la conductividad a se pueden evaluar, como antes, en relación con (7 .3-15), lo cual da

con

e-r(e1 )

J.L=--. m

(7.3-27)

Parece que estos resultados son los mismos que se encontraron para el caso Maxwell-Boltzmann (7.3-11), etc., excepto que el tiempo libre medio promedio r se representa mediante el valor r(v) en la "velocidad de Fermi" v1 , en donde

tmv} = e1 .

(7.3-28)

En este caso, las estadísticas sólo establecen una diferencia en los detalles de los promedios y no afectan la conductividad por órdenes de magnitud. Esto se comprende desde el punto de vista físico, ya que, en cualquiera de los casos, el campo sólo tiene el efecto de superponer una velocidad de arrastre del orden de eE0 r/m en todos los electrones de la distribución, como se ilustra en la figura 7.2, sin tener en cuenta los detalles de su distribución de energía. En todo caso, la introducción de la estadística Fermi-Dirac, aunque modifica algunos de los detalles, conserva las características esenciales de la representación del electrón libre de Drude-Lorentz-Boltzmann de la conducción eléctrica, que es básicamente correcta. Sin embargo, como se verá a su debido tiempo, las capacidades térmicas predichas por las estadísticas de Maxwell y Fermi-Dirac para electrones libres en metales, son

Figura 7.2.

Las distribuciones Maxwell-Boltzmann (MB) y Fermi-Dirac (FD) de la componente de velocidad z en presencia de un campo eléctrico.

Conductividad térmica y efectos termoeléctricos

215

realmente muy diferentes y, en este caso, el uso de la estadística Fermi-Dirac es esencial para explicar los resultados experimentales.

7.4

CONDUCTIVIDAD TERMICA Y EFECTOS TERMOELECTRICOS EN SISTEMAS DE ELECTRONES LIBRES

Al estudiar la conductividad térmica de los electrones libres, es necesario considerar una muestra en la que no haya corriente eléctrica alguna, pero sí un gradiente de temperatura. Entonces la función de distribución en cualquier punto se caracteriza, por la temperatura local y se debe considerar como una función de la posición y de la energía. Al igual que antes, se supondrá que se trata de una muestra isotrópica homogénea y, para simplificar, se supondrá que la temperatura varía únicamente a lo largo de la dirección z. Desde un principio se trabajará con las estadística de Fermi-Dirac; el caso de la estadística Maxwell-Boltzmann se puede obtener para una situación especial del resultado Fermi-Dirac, cuando se permite que la energía de Fermi aumente y sea negativa. En estas condiciones, la ecuación de Boltzmann para el estado estacionario, utilizando la aproximación del tiempo de relajación acostumbrada, con r = r(v) se puede expresar como sigue (7.4-1) En esta ecuación, las derivadas de la función de distribución real con respecto a z y Vz, se han aproximado mediante los valores de la correspondiente función de distribución de equilibrio análogamente al razonamiento que se empleó para la ecuación (7.3-2). Se supone que el campo E0 sólo tiene una componente z. La ecuación anterior se puede volver a escribir como sigue

f = fo

+ -r(eEo aJo m avz

Vz

afo).

(7.4-2)

az

Si se utiliza la expresión (5.5-20) para representar fo y si se recuerda que e1 es una función de la temperatura, con la ayuda de (7 .3-19) se puede escribir la cantidad of0 /oz como sigue

=fo0-fo)[e-e1 + ae,]aT =[r!...(~) kT T aT az aT T

~]f0 (1-f0 )aT

+T

kT

az .

(7.4-3)

A continuación, la ecuación de Boltzmann se puede escribir en la forma (7.4-4)

216

Teoría del electrón libre de los metales Al igual que antes, la densidad de la corriente eléctrica lz es

=-env

1 z

f

vzf(v,z)g(v) d 3 v

=-en~----------

(7.4-5)

ff(v,z)g(v) d v ' 3

z

mientras que a la densidad de la corriente térmica Qz la representará la energía portada por una partícula multiplicada por la compónente z de su velocidad, y por la densidad de partículas, de donde,

_ J Qz=n(ev,)=n

evzf(v,z)g(v) dv

-

J

(7.4-6)

f(v,z)g(v) dv

Al substituir la función de distribución (7.4-4) en (7.4-5) y (7.4-6), se obtienen expresiones análogas a (7 .3-7). Debido exactamente a las mismas razones que se indicaron en relación con dicha ecuación, la integral del primer término del numerador de estas expresiones (incluyendo [ 0 ), deben anularse y también debe desaparecer la integral del segundo término del denominador (incluyendo [ 0 (1 - [ 0 )). Por tanto, se tiene

en

f

v!r [ kT/0 (1 - / 0) eE0

+

(

T

f

e) iJT] iJz d v

iJ(e1 fT) ---aT +T

3

1 =~~--------~~~--------~--~-% f 0 (v) d3 v

(7.4-7)

y

-n

f

v!r [ ( iJ(e1 /T) e2 ) iJT] 3 kT/0 (1- / 0 ) eE 0 e + eT aT + T i)z d v

Q = ____;:;_,__ _ _

..;:,_;;--___;_---__;._____;;~

Jf

(7.4-8)

0 (v) d 3 v

z

Sin entrar en los detalles de la evaluación de estas integrales y gracias a los resultados obtenidos en la sección anterior, es evidente, que estas ecuaciones se pueden expresar como

en [ ( eE0 + 1 ,iJ(e1 iJT - ] 1 /T) iJT) _ - - t +-- (et)

(7.4-9)

-n [( iJ(e1 /T) iJT)- 1 iJT2 ] =--;;¡eE0 + T ---a;¡- iJz (er) + T 0 z (e t)

(7.4-10)

1, =--

m

iJT

iJz

T iJz

y

Q,

en donde las cantidades sobre las que se ha escrito una barra son los promedios definidos por

(7.4-11)

Conductividad térmica y efectos termoeléctricos

217

Si se observa que mv; = mv 2 cos2 e, y se supone que a es independiente de las variables angulares, entonces se puede integrar (7.4-11) sobre los ángulos para obtener _ (X

m

= -3kT

f

v2 tX(v)J0 (1 -Jo)·

f •o . JI

V2

dv

=v2 dv

f'-----=-----f e312 tX(e)J0 (l -Jo) de

2

3kT

(7.4-12)

e ¡,0 de 112

En las expresiones (7 .4-12) y (7 .3-1 0), se ve que cuando la distribución de Fermi se reduce a una distribución de Maxwell (según la cual 1 -lo ~ 1 Y fo = Ae-efkT), la Ci promedio se reduce a (7.4-13)

análogamente a (7 .3-12) y los promedios se toman sobre la distribución de MaxwellBoltzmann. De igual manera, si la distribución es de tipo Fermi, para la que kT
(7.4-14)

Si no fluye una corriente eléctrica, lz = O, por lo cual, de acuerdo con (7 .4-9), se debe tener

eE 0

o(e /T) ar 1 ar (er) --= - - - oT oz T oz i '

+ T -1- -

(7.4-15)

de donde,

Eo

=

_! [_!_ (et) + T o(e1 jT)] oT e T i

oT

T !..__ [(et)- e1 oT eiT

i] oT oz .

oz

(7.4-16)

o bien,

Eo

=

(7.4-17)

De acuerdo con esto, parece que aun en ausencia de una corriente, debe existir un campo eléctrico cuando se tiene un gradiente de temperatura. De hecho, lo hay y la ecuación anterior es la descripción fundamental del efecto termoeléctrico. Fenomenológicamente se puede definir el coeficiente de Thomson como el coeficiente de proporcionalidad que relaciona el campo eléctrico con el gradiente de temperatura que lo origina, como sigue,

Eo

q¡-ar

= - ::/ -

oz

(7.4-18)

218

Teoría del electrón libre de los metales

según lo cual, el coeficiente de Thomson fí debe estar dado por fí

'f].

= _ T !..._ [(st)- e1 iJT

e'CT

(7.4-19)

De acuerdo con (7.4-9) y (7.4-10), también es evidente que si existe un campo eléctrico aplicado que hace que fluya una corriente eléctrica, incluso cuando oTjoz =O, la corriente térmica Qz no desaparece. Por el contrario, existe una corriente térmica que es proporcional al campo eléctrico E 0 y, por tanto, a la corriente eléctrica. Este efecto se denomina calentamiento Thomson y es muy diferente del calentamiento ordinario irreversible de Joule que se relaciona con el paso de una corriente por un medio resistivo. El voltaje que desarrolla un termopar por diferencia unitaria de temperatura se defme como la diferencia de las potencias termoeléctricas relacionadas con los dos constituyentes del par. Mediante un argumento termodinámico sencillo,6 se puede demostrar que la potencia termoeléctrica absoluta {!J de una substancia está relacionada con el coeficiente de Thomson mediante (7.4-20)

por lo cual, de acuerdo con (7.4-19), se debe tener f!jJ

'f- (s-r).

= e1

e'CT Si lz =O, utilizando (7.4-15), el término relacionado con el campo eléctrico más una contribución que incluye al gradiente de temperatura y la derivada de la temperatura de la energía de Fermi, se puede eliminar de (7.4-10) para dar --

__ 2

Qz = _u, iJT = - n ['f(e 2 t) - (st)] iJz mT t

(7.4-21)

por lo cual, la conductividad térmica at es, sencillamente, -2

__2

= ~ ['f(s t)- (et)]

u

'

mT

'f

·

(7.4-22)

De acuerdo con esto, es evidente que la teoría del electrón libre de Fermi y la representación del electrón libre de Boltzmann difieren sólo en algunos detalles de los promedios y que ambos métodos llevan a una conductividad térmica del mismo orden de magnitud, al igual que ambos predicen más o menos la misma conductividad eléctrica. De acuerdo con las investigaciones experimentales de Wiedemann y Franz, la relación atf(Tae), en donde ae es la conductividad eléctrica, es aproximadamente la misma para casi todos los conductores metálicos, independientemente de la temperatura. Puesto que a, = ne 2 r/m, la relación Wiedemann-Franz, se puede expresar como --

_ _2

L = ..!!.!_ = _1_ 'f(s 2 t) - (et) Tue e2T2 t2 6

(7.4-23)

M. W. Zemansky, Heat and Thermodinamics, McGraw-Hill Book Co., Inc., Nueva York

(1951) página 301.

Procesos de dispersión

219

Esto parece indicar que si r(e) es la misma función de energía para todas las substancias metálicas, la relación Wiedemann-Franz será la misma para todos los materiales. Puesto que cada factor de e contribuye kT a los promedios, la relación Wiedemann-Franz será independiente de la temperatura. En realidad, si r(e) varía lentamente con respecto a e, la relación Wiedemann-Franz será casi la misma incluso si r(e) no es la misma función de energía para todas las substancias. En particular, si la trayectoria libre media X e~ independiente de la energía, entonces, de acuerdo con (7 .3-18), utilizando la representación clásica del electrón libre de Boltzmann, de Drude y Lorentz, la conductividad térmica está dada por (7.4-24) en tanto que la relación Wiedemann-Franz se convierte en (7.4-25) independiente de la trayectoria libre media o la temperatura. La magnitud de L + según está dada por (7 .4-25) y concuerda de manera aceptable con los valores determinados en forma experimental para casi todos los metales puros. Si se trata de evaluar la conductividad térmica y la relación Wiedemann-Franz, por medio de la estadística de Fermi y los valores promedio, como se calcularon de acuerdo con (7 .4-14), entonces se obtiene el resultado at = L = O! Esta situación sorprendente se origina debido a la representación de / 0 (1 - [ 0 ) como una función de l> y el método sólo aproximado de la integral de Fermi en el denominador (como en (7.3-26)) de las expresiones para los promedios que conducen a (7.4-14), no es lo suficientemente exacta para estos cálculos. Si e¡ se expresa como kTF en (7.4-23), es evidente que, en realidad, esto sólo se refiere a una pequefia diferencia entre dos cantidades muy grandes del orden de (k 2 /e 2 ) (TpfT)l, y las dos cantidades propiamente dichas se deben expresar con gran exactitud a fin de que su diferencia sea más o menos correcta. Un método más preciso, como el presentado por Smith, 7 da el resultado (7.4-26) y (7.4-27)

7 .S

PROCESOS DE DISPERSION

En todas las expostcwnes anteriores, la idea central era que los electrones libres sufren colisiones instantáneas que tienden a hacerles volver a la distribución de equilibrio; sin embargo, hasta ahora se ha evitado conscientemente el responder a la 7 R. A. Smith, Wave Mechanics of Crystalline Solids, Chapman and Hall, Londres (1961) página 328.

220

Teoría del electrón libre de los metales

pregunta "¿colisiones con qué? " La fmalidad de esta sección es analizar cualitativamente la respuesta a tal pregunta. Como se verá en detalle en el siguiente capítulo, los electrones libres que se mueven en forma independiente dentro del potencial de una red cristalina perfectamente periódica no están sujetos en absoluto a interacciones de dispersión con todos los átomos de la red. Es más, en las colisiones elásticas que suceden entre los electrones se conservan la energía y cada componente de la cantidad de movimiento; debido a ello, no se origina ningún cambio neto en la corriente eléctrica ni en la térmica. Por tanto, los mecanismos de colisión que producen la aleatorización de la distribución electrónica deben estar asociados con impurezas, imperfecciones o faltas de periodicidad de un tipo u otro en el cristal. Sea un cristal que no contiene átomos de impurezas o imperfecciones estructurales en absoluto. Si no existiera el movimiento térmico de los átomos alrededor de sus posiciones de equilibrio, el potencial eléctrico experimentado por un electrón dentro del cristal sería perfectamente periódico y no habría mecanismos en absoluto para hacer que los electrones volvieran al estado de equilibrio térmico por acción de fuerzas eléctricas o magnéticas externas. Sin embargo, debido a las vibraciones térmicas de los átomos, en cualquier momento dado hay una leve aperiodicidad del potencial dentro del cristal; ésta sirve para dispersar los electrones de conducción. disipando cualquier velocidad de arrastre que puedan haber adquirido de los campos aplicados externamente y devolviéndolos al estado de equilibrio térmico. Es evidente que mientras más alta es la temperatura, tanto más fuertes son las vibraciones de red y más alta la probabilidad de dispersión por unidad de tiempo. Por tanto, este mecanismo de dispersión conduce a un tiempo libre medio [y, en consecuencia, de acuerdo con (7.3-15), a una conductividad] que decrece al aumentar la temperatura. Esto concuerda con las observaciones experimentales de metales puros. Puesto que las vibraciones de red se pueden considerar como cuantos semejantes a partículas de energía vibratoria (fonones), la interacción de dispersión entre los electrones y los fonones se puede describir como un proceso de colisión casi mecánico que incluye a los electrones libres y a los fonones, donde estos últimos se comportan como partículas neutras cuya masa es mucho mayor que la del electrón. 8 Debido al hecho de que los fonones son neutros, la corriente no se conserva en estas colisiones. Puesto que la "masa" del fonón es mucho mayor que la masa electrónica, la fracción de energía que pierde el electrón en la interacción electrónfonón es pequeña, aunque por supuesto, el cambio de cantidad de movimiento del electrón puede ser muy grande. Los electrones pueden interactuar con fonones de modo acústico u óptico, aunque, dado que se requiere una energía térmica mucho mayor para excitar a los fonones de modo óptico, la principal interacción a temperaturas moderadas es con fonones acústicos. Las dos interacciones son similares en sus aspectos cualitativos, aunque conducen a ciertas diferencias cuantitativas en los coeficientes de transporte, sobre todo la dependencia del tiempo de relajación en función de la temperatura (de ahí que la movilidad dependa de la temperatura). A cualquier temperatura dada, el número de fonones disponibles es constante. Puesto que los fonones se comportan como partículas masivas casi estacionarias, la probabilidad de dispersión por unidad de distancia a lo largo de la trayectoria de un electrón es una cantidad determinada de un modo puramente geométrico, la cual sólo depende de la sección transversal geométrica efectiva relacionada con el fonón e independiente de la velocidad del electrón. Por tanto, la trayectoria libre media es independiente de la velocidad de partícula en estas circunstancias, como se hizo notar en la sección 7 .2. El tiempo libre medio está dado por

A. -r(v) =V

8

Véase, por ejemplo, el problema 4 que aparece al final del capítulo 6.

(7.5-1)

Procesos de dispersión

221

en donde A es independiente de v, llegando a la relación (7.3-18) entre 7 y A. Por supuesto, el número de fonones disponibles es una función de la temperatura y, por tanto, A será una función de la temperatura a pesar de que es independiente de la velocidad. Este mecanismo de dispersión de red o dispersión de fonón, es el proceso dominante de dispersión en cristales relativamente puros y estructuralmente perfectos, sobre todo en los rangos de temperaturas elevadas. Generalmente, si hay un átomo de impureza en un cristal, esto altera el potencial electrostático en las cercanías y crea una aperiodicidad en el campo de potencial dentro del cristal, que puede actuar para dispersar electrones de conducción. Obviamente, los detalles del proceso de dispersión dependen de la naturaleza del átomo de impureza, su tamaño iónico, su valencia y la forma en que está enlazado dentro de la red cristalina. En lo que respecta a otras cosas, la presencia de átomos de impurezas en un cristal puro aumenta el tiempo libre medio que haya entre los eventos de dispersión y lleva a una reducción de la conductividad eléctrica que será proporcional al contenido de impurezas. A decir verdad, este efecto se observa experimentalmente en gran número de substancias. 9 El mecanismo de dispersión de impurezas casi siempre es dominante en cristales que son relativamente impuros o incluso en muestras muy puras a temperaturas muy bajas, cuando el mecanismo de fonones es débil. Las imperfecciones estructurales en la red cristalina, tales corno vacíos de red, átomos intersticiales, dislocaciones y fronteras de grano, también conducen a aperiodicidades en el potencial del cristal y, por tanto, a centros de dispersión con los que los electrones de conducción pueden interactuar. Entonces las propiedades de transporte del cristal reciben la influencia en mayor o menor grado, de la perfección estructural de la red. En algunas circunstancias, la dispersión de electrones por las superficies de la muestra también puede ser importante. Ya se vio (en la sección 6.6) la forma en que la dispersión de superficie de los fonones es a veces un factor importante en la componente reticular de la conductividad térmica a temperaturas bajas. Si dos mecanismos independientes de dispersión (por ejemplo, la dispersión de red y la de impurezas) operan simultáneamente para termalizar la función de distribución de energía electrónica, se tendrán dos tiempos de relajación T 1 y T 2 , asociados con los mecanismos respectivos. En el ejemplo anterior, T 1 puede representar el tiempo de trayectoria libre que transcurre entre los sucesos de dispersión de red y r 2 el tiempo libre medio que pasa entre las dispersiones de impurezas. En estas condiciones, el término de colisión de la ecuación de Boltzrnann se puede escribir corno sigue

f- fo f- fo f- fo =------=---

(7.5-2)

en donde

1

1

1

T



T2

-=-+-.

(7.5-3)

Esto hace ver que el efecto combinado de dos mecanismos de dispersión se puede representar mediante un solo tiempo de relajación T relacionado con T 1 y T 2 mediante la fórmula de suma recíproca (7.5-3). De igual manera, si se tienen más de

9 Por ejemplo, esta es la razón por la que se requiere cobre de muy alto grado de pureza para conductores eléctricos en sistemas comerciales de transmisión de potencia.

222

Teoría del electrón libre de los metales

dos mecanismos, su efecto se puede representar por medio de un solo tiempo de relajación r dado por

1

1

-=¿-. • 1 't¡

(7.5-4)

Puesto que, de acuerdo con (7.3-13), las movilidades son directamente proporcionales a los tiempos de relajación, las movilidades producidas por mecanismos independientes de dispersión por separado pueden sumarse recíprocamente en la misma forma para dar una movilidad combinada de la forma

1

1

-=¿-. J1. i Jl.¡

(7.5-5)

Las trayectorias libres medias originadas por procesos de dispersión separados también se pueden sumar recíprocamente para llegar a una trayectoria libre media general No obstante, debe observarse que las fórmulas de suma (7.54) y (7.5-5) han de aplicarse antes y no después de promediar sobre la velocidad.

7.6

EL EFECTO DE HALL Y OTROS EFECTOS GALVANOMAGNETICOS

Hasta ahora se han estudiado sólo casos en los que un campo eléctrico actúa sobre las partículas de un sistema de electrones libres. Si además se tiene un campo magnético, la fuerza ejercida sobre una partícula de carga q está dada por la fuerza de Lorentz F

1 v X B) e

= q(E + -

(7.6-1)

y la ecuación de Boltzmann en el estado estacionario, utilizando la aproximación del tiempo de relajación, se convierte en (7.6-2)

La solución de esta ecuación incluye varios efectos galvanomagnéticos que se originan en la interacción de campos eléctricos y magnéticos, y gradientes térmicos, con las partículas de la distribución. Por ahora no se verán los detalles de la solución de la ecuación de Boltzmann, sino que la explicación se restringirá a la descripción fenomenológica de estos efectos. En un capítulo posterior se hará un análisis más riguroso de los fenómenos galvanomagnéticos y la forma en que se aplican a semiconductores, en donde será más fácil llegar a soluciones analíticas exactas. El más importante de los efectos galvanomagnéticos es el efecto de Hall, en el que se produce un campo eléctrico en la dirección y como resultado de una corriente que fluye en la dirección x y un campo magnético a lo largo de la dirección z, según se ilustra en la figura 7.3. En esta figura, un electrón que se mueve con velocidad vx está sometido a un empuje descendente debido a la fuerza de Lorentz. En el estado estacionario no puede haber una fuerza neta ejercida sobre el electrón

El efecto de Hall y otros efectos galvanomagnéticos

Io-

Figura 7.3.

223

vH (Medido con un potenciómetro en condiciones de circuito abierto)

Geometría del experimento del efecto de Hall.

~- por tanto, lo que sucede es que se desarrolla un exceso de concentración de electrones en el borde inferior de la muestra, hasta que se genera un campo electrostático Ey que equilibra exactamente a la fuerza de Lorentz. Por tanto,

q

F1 = - (v X B0 ) 1 c

-

evxBo e

eE1 = - - - eE = O 1

'

(7.6-3)

por lo cual, E = vxBo

'

e

(7.6-4)

Sin embargo, la densidad de corriente 10 es 10 = -nevx.

(7.6-5)

Si se expresa Vx de (7.6-4) en función de 10 por medio de (7.6-5), el campo .ie Hall Ey se puede expresar como -loBo E , = - - = Rl 0 B0 nec

(7.6-6)

m donde el coeficiente de Hall R está dado por 1 R=--. nec

(7.6-7)

El campo de Hall es directamente proporcional tanto a 10 , como a B 0 • El .:oeficiente de Hall R es, sencillamente, la constante de proporcionalidad entre el :.ampo de Hall y el producto 10 B 0 • El campo de Hall se puede determinar midiendo ei voltaje de Hall VH de la figura 7.3 de una manera potenciométrica. Por tanto, el .:ampo de Hall y el voltaje de Hall están relacionados por medio de

(7.6-8) en donde y 0 es la anchura de la muestra. El coeficiente de Hall R se puede medir si te conocen VH, 10 y Bo. El coeficiente de Hall es inversamente proporcional a la densidad n de portadores de carga de la muestra, y una medición de R constituye un modo sencillo de

224

Teoría del electrón libre de los metales

determinar n. Combinando las mediciones del coeficiente de Hall y la conductividad, se puede obtener la movilidad /J., ya que, de acuerdo con (7 .6-7) y (7 .3-17), 1 JJ. Ru= --(nep)= - nee e

o bien, 1 p = - - Ru. e

(7.6-9)

El análisis anterior del efecto de Hall se ha simplificado en exceso en el sentido de que todos los portadores de carga no tienen la misma componente de velocidad Vx y, por tanto, se debe promediar sobre la distribución de Vx. Por lo general, el efecto de esto es cambiar el valor (7.6-7) por R mediante un pequeño factor numérico. De acuerdo con (7 .6-7) si los portadores de carga son electrones, R siempre debe ser negativo. Se ha encontrado experimentalmente que R es positivo para muchas substancias metálicas y semiconductoras. La aparición de un coeficiente de Hall positivo se puede explicar, suponiendo que los portadores de carga son positivos, en lugar de negativos; pero la teoría del electrón libre de los metales no proporcionan un modo racional para explicar la presencia de portadores de carga positivos. Los coeficientes de Hall positivos y la existencia de portadores de carga positivos se pueden explicar mediante la teoría cuántica, como se verá en el siguiente capítulo. En el arreglo experimental de la figura 7.3, se establece un gradiente de temperatura a lo largo de la dirección y junto con el campo de Hall Ey. Esto se debe a que, de acuerdo con la ley de Lorentz de la fuerza, toda fuerza ejercida verticalmente hacia abajo sobre los electrones es proporcional a Vx y, por tanto, sobre los electrones más energéticos y rápidos, la fuerza ejercida v x 8 0 es mayor; en consecuencia, estos electrones tienden a acumularse en la parte inferior de la muestra, elevando su temperatura con respecto a la parte superior, donde permanecen los electrones "más fríos". El gradiente de temperatura resultante crea un campo termoeléctrico en la dirección y, el cual está dado por (7.4-17) y origina un voltaje adicional diferente del voltaje de Hall, en las terminales y de la muestra. Este fenómeno se conoce como efecto de Ettingshausen, y en algunos casos, puede interferir mucho en las mediciones de voltaje de Hall. Tal efecto en las mediciones de Hall se puede eliminar si se utiliza una corriente alterna de muestra, cuyo periodo sea corto en comparación con la constante térmica de tiempo de la muestra, en combinación con un detector de corriente alterna. Cuando la corriente eléctrica / 0 en el experimento del efecto de Hall, se substituye por una corriente térmica, se puede medir todavía un campo eléctrico a lo largo de la dirección y. En este caso, existe en promedio un transporte neto de electrones más rápidos, dentro de la dirección x, desde el extremo vivo o caliente, hasta el extremo frío de la muestra, y la fuerza v x B0 actúa sobre ellos, para producir un campo eléctrico, más o menos en la misma forma en que se produce el campo de Hall, cuando fluye una corriente eléctrica. Este fenómeno se denomina efecto de Nernts. El campo de Nernst va acompañado por un gradiente de temperatura a lo largo dat la dirección y al igual que lo que sucede con el campo de Hall; esto origina un voltaje termoeléctrico adicional análogo al de Ettingshausen. El efecto termoeléctrico originado por el efecto de Nernst se denomina efecto de RighiLeduc. En un campo magnético, los electrones se desplazan siguiendo trayectorias curvas y no rectas; gracias a este hecho se ha descubierto que, por lo general, la conductividad depende del campo magnético. Este fenómeno se llama magneto"esistencia y se estudiará más detalladamente en un capítulo posterior.

Capacidad térmica de sistemas de electrones libres 7.7

225

CAPACIDAD TERMICA DE SISTEMAS DE ELECTRONES LIBRES

La teoría clásica del electrón libre de Drude-Lorentz, en la que se supone que los electrones libres obedecen a la estadística de Maxwell-Boltzmann, lleva a la conclusión de que (suponiendo un electrón libre por átomo) la capacidad térmica de los electrones libres debe ser -fnk, como lo da la figura (5.4-11). Entonces la capacidad térmica total sería igual a la suma de la contribución reticular dada por la teoría de Debye, y la contribución electrónica -fnk, y a temperaturas altas, en comparación con la Debye, el valor límite de la capacidad térmica, sería -!nk. Sin embargo, esta conclusión está en discordancia con los experimentos, ya que las observaciones indican que el valor asintótico de la capacidad térmica a altas temperaturas difiere muy poco del valor 3nk predicho por la teoría de Debye para la contribución reticular sola. Aparentemente, esto indica que la capacida-d térmica de los electrones libres es mucho más pequeña que el valor predicho a bc;se del modelo Drude-Lorentz-Boltzmann. Esta fue una de las principales fallas del modelo original DrudeLorentz, que se propuso primero. Como se verá más tarde, resulta que cuando se utilizan las estadísticas de Fermi-Dirac, para describir la distribución de energía drl electrón libre, la capacidad térmica electrónica calculada es mucho más pequeña q~tl' el valor 3/2nk dado por la estadística de Boltzmann y, en efecto, es despreciable en comparación con la con tribución reticular a temperaturas moderadas y altas. En consecuencia, el modelo del electrón libre de Fermi está mucho más de acuerdo con las observaciones experimentales que la teoría original de Drude-Lorentz. La explicación de calor específico electrónico de substancias metálicas fue uno de los triunfos originales de la estadística cuántica. La capacidad térmica del sistema del electrón libre de Fermi-Dirac es mucho más pequeña porque ~AJo los electrones dentro de unos cuantos kT de la superficie de la esfera de Fermi pueden recibir energía de una fuent~, térmica externa. Por lo común, una partícula de un baño térmico externo a la temperatura T sólo dispone de una energía de unos cuantos kT, para transmitirla a un electrón del sistema de electrones libres de Fermi. Los electrones que se encuentran en un lugar profundo, dentro de la esfera de Fermi no pueden interactuar con este tipo de cuerpos externos excitantes, ya que no existen estados desocupados dentro de unos cuantos kT de energía, hacia los que puedan excitarse. Sólo los electrones que están cerca de la superficie de Fermi, en donde existen estados desocupados disponibles, pueden participar en las interacciones con una fuente térmica externa. Para hacer un cálculo exacto de la capacidad térmica, es necesario tener en cuenta la variación de primer orden de la energía de Fermi con la temperatura. Para lograr esto, será necesario evaluar la integral 1=

f

oo

0

acb(e)

f 0 (e) &

(7.7-1)

de.

en donde / 0 es la función de Fermi y q¡{e) es una función de e que tiene la propiedad de que l/J(O) =O.

(7.7-2)

Si (7.7-1) se integra por partes, puede verse con facilidad que 1 se puede expresar en la forma l =

[f

0 (e)c/J(e)

a¡; = - feo l/J(c) ~ a¡; de, ]eo - feo l/J(e) ~de o

o

oe

o

iJ¡;

(7.7-3)

226

Teoría del electrón libre de los metales

ya que el producto f 0 (e)r/>(e) se anula en ambos límites. En la expansión de cf>(e) como una serie de Taylor en torno al punto e= e1, puede escribirse como

f/>(e) = f/>(e¡) +(e- e¡) (of/>) oe t¡

2 1 + 2(ee¡) (oiJe2f/>) t¡ + ... ' 2

(7.7-4)

por lo cual, (7.7-3) se puede expresar como

1 = a0 fj>(e1 )

- 2 + a 1 (of/>) + a2 (a24>) + ... , oe

oe



(7.7-5)

•J

en donde

1 J<Xl(e- e¡)"~ a¡; de. an = - n! o oe

(7.7-6)

Ahora bien, si kT <{ e1, de acuerdo con (7 .3-19), a¡0 jae es despreciable para valores negativos de e y los límites de la integral (7.7-6) se pueden extender a oo y - oo. Si esto se hace, se encontrará que

a0 = -

J J <Xl

-a;¡

a1

=-

ofo [ J<Xl = 1 - de = fo oe -oc

(7.7-7)

ofo (e- e1 ) - de= O oe

(7.7-8)

<Xl

-a;¡

(7.7-9) La integral de (7.7-8) se anula porque at0 /ae es una función par de e- e¡ y el integrando es, por tanto, una función impar de dicho argumento que, cuando se integra desde - oo a + oo, debe dar cero. La integral de (7.7-9) se pone en la forma antes indicada, mediante la substitución de x =(e- e¡)/kT; esta forma aparece en casi todas las tablas estándar de integrales definidas. Al substituir estos valores en (7.7-5), el resultado es

1=

f

<X>

p

of/> 1t2 (a2 4>) + ... f 0 (e)de= fj>(e1 ) +- (kT) 2 - 2 oe

6

oe

(7.7-10)

•¡

Esta fórmula es conveniente para sacar valores aproximados de las integrales de Fermi, donde la aproximación de la función 8 para a¡0 jae no es suficientemente buena. Está restringida por la condición (7 .7 -2) y por la condición de que kT <{ e1. Este método se puede usar para evaluar la relación Wiedemann-Franz para un gas de Fermi; los detalles quedan como ejercicio para el lector. Ahora suponga que se escoge

f/>(e) =

f~g(e) de

(7.7-11)

en donde

a¡p¡ae

= g(e)

(7.7-12)

Capacidad térmica de sistemas de electrones libres

227

siendo que g(e), como lo establece (5.2-22), se refiere a un sistema de electrones libres. Por tanto, de acuerdo con (7.7-10),

n

f

= oo/ 0 (e)g(e) de = o

i''
6

o

oe .,

(7.7-13)

Sin embargo, de acuerdo con (5.5-24),

1''(0)

n

=Jo

g(e) de.

(7.7-14)

Al restar (7.7-14) de (7.7-13), se tiene,

o= f. •,
s¡(OJ

e .,

(7.7-15) En la ecuación anterior se supuso que g(e) no varía mucho en el intervalo de

e¡(O) a e¡(1), que, para kT ~e¡ será sólo una pequeña fracción de e¡(O). Puesto que g(e) es de la forma ce 1 12 con e igual a una constante. (7.7-15) se puede escribir como sigue

e1(T)

n2 (kT)z

= e1 (0)- - - - .

12 e¡(T)

(7.7-16)

Para kT <{ e1 , el segundo término será una pequeña corrección que debe restarse de la cantidad relativamente grande e¡(O) y la diferencia y e¡(1) y e¡(O) será pequeña, en comparación con e¡(O). En estas circunstancias no se producirá un error grande si e¡(1) en el término de corrección de (7.7-16) se substituye con e¡(O), lo cual da, finalmente,

nz(kT\z] e¡(T) = e¡(O) [ 1 - 12 e¡(O)/ .

(7.7-17)

Para evaluar el calor específico electrónico, se escoge

cjJ(e) =

f~ e g(e) de

(7.7-18)

en donde

ocjJfoe

= e g(e)

(7.7-19)

y

Entonces, al substituir en (7.7-10), se tiene que

oo ocjJ ioo i f 0 (e)- de = e g(e)f0 (e) de = U o

oe

o

(7.7-20)

228

Teoría del electrón libre de los metales

y

U =

l

•,

e g(e) de

o

n2 [ 0 J +(kT) 2 -(e g(e)) .

oe

6

.,

También en este caso, si se usa el hecho de que g( e)= ce 1 12 , esto se puede escribir como,

l

<¡(O)

U =

fe¡(T)

e g(e) de+

O

e g(e) de

¡¡;2

3

6

2

+- (kT) 2 ·- g(e1 )

e¡(O)

(7.7-21) Aquí, U0 es el valor de cero absoluto de la energía interna, según se representa mediante la integral de e g(e) desde O hasta efO), y la integral de esta cantidad en el rango pequeño e,(O) a efT) se ha aproximado, siguiendo el mismo procedimiento que se utilizó en relación con (7.7-15). En el último término de (7.7-21), g(e) se evalúa a efO) más que en ef1), lo cual introduce sólo un pequeño error. Al substituir el valor de ef1)-ef0) dado por (7.7-17) en (7.7-12), se puede escribir (7.7-22) De acuerdo con (5.2-22) y (5.5-25), g(ej(O)) se puede expresar como g(e¡(O)) =

(3n)

sJ2n m3f2[e¡(O)]If2 = 4nm -¡;r- -;

---¡;J

l/J

,

que, puesto que según lo indica (5.5-25), la relación mjh 2 es igual a (3n/rr)21 3 j (8et(O)), se puede escribir 3n

3n

g(e¡(O)) = 2e1 (0) = 2kTF.

(7. 7-23)

Substituyendo este valor en (7. 7-22), se tiene, por último, (7. 7-24)

La capacidad térmica se obtiene en la forma acostumbrada y el resultado es

e

=

au =

" ar

n2

2

nk(I..). TF

(7. 7-25)

Esta expresión difiere del resultado clásico i:nk multiplicado por un factor (rr 2 /3)(T/Tp), que resulta 0.03 para T=300°K y Tp=30,000°K [un valor típico para metales simples, calculado a partir de (5.5-25)]. Por tanto, la componente

Capacidad térmica de sistemas de electrones libres

229

electrónica del calor específico, según se calcula mediante la estadística de Fermi, resulta de sólo una pequeña fracción del valor de Drude-Lorentz fnk, y -es pequeñaexcepto a temperaturas muy bajas en comparación con la contribución reticular. A temperaturas pequeñas, en comparación con la de Debye, la contribución reticular se hace muy pequeña, aproximándose a cero, al igual que t 3 conforme T-+ O. En este rango, la contribución electrónica frecuentemente es un factor importante y, en ciertas gamas de temperaturas, puede ser incluso el efecto dominante. Se puede reconocer fácilmente en los datos experimentales, debido a su dependencia lineal de la temperatura, como lo indica (7. 7-25).

EJERCICIOS l. Demuestre que si 'T es independiente de v, la función de distribución es una solución apro-m(v-vo) 2

f(v)

2kT

= Ae

(donde Vu = ;;;-

Eo)

ximada de la ecuación de Boltzmann en el caso en que la distribución de Maxwell-Boltzmann represente la función de distnbución de equilibrio y en donde v0 <{,(kT/m) 112 . 2. Suponiendo la estadística de Maxwell-Boltzrnann, evalúe fa partir de (7.3-12), suponga que la dependencia de 'T sobre la energía está dada por 1 (E) =A e-s, en donde A y s son constantes. 3. En un metal como el cobre (resistividad 1.7 X I0-6 ohms-cm), ¿Cuál es, aproximadamente, el máximo campo eléctrico para el que podría aplicarse el método del electrón libre de Drude o Fermi estudiado en la sección 7 .3? ¿Cuál es la densidad de corriente para este valor del campo? 4. A partir de (7.7-10) y (7.7-17), deduzca las fórmulas (7.4-26) y (7.4-27) para la conductividad térmica y la relación de Wiedemann-Franz de un ga• de Fermi de electrones libres, usando la aproximación kT 4;.efi0). 5. Si se adopta la representación del electrón libre de Fermi de una superficie metálica, como se ilustra en el diagrama incluido, demuestre que existe una corriente de emisión termoiónica que puede fluir desde la barrera de potencial superficial, y que la densidad de la corriente termoiónica está dada por

1 - 4TTem(kT)2 -

h'

e

-
Jx.

Suponga que r/>0 , la función de trabajo es ~k T. 6. Demuestre que si la trayectoria libre media es independiente de la velocidad, la conductividad eléctrica de un gas de electrones libres de Maxwell-Boltzmann, puede expresarse como

a= 4ne 2Afy2TTmkT. 7. Describa físicamente el origen del efecto termoeléctrico. (Nota: considere una barra larga, la mitad de la cual se mantiene a la temperatura T 1 y la otra a la temperatura T2 (>T 1 ) Y calcule los flujos electrónicos en ambas direcciones en la interfaz entre las dos regiones. Use la estadística de Maxwell-Boltzmann.)

t

r-

(x)

T


~~~~~~~~~~~~~•=O

Superficie

230

Teoría del electrón libre de los metales LECTURAS RECOMENDADAS

F. J. Blatt, Theory o[ Mobility o[ Electrons in Solids, Salid State Physics, Advances in Research and Applications, Vol. 4, Academic Press, Inc., Nueva York (1957), pp. 199-366. J. R. Drabble y H. J. Goldsmid, Thermal Conduction in Semiconductors, Pergamon Press, Oxford (1961). J.-P. Jan, Galvanomagnetic and Thermomagnetic E[[ects in Metals, Salid State Physics, Advances in Research and Applications, Vol. 5, Academic Press, Inc., Nueva York (1957), pp. 1-96. E. H. Putley, The Hall E[[ect and Related Phenomena, Butterworth & Co., Ltd., Londres (1960). F. Seitz, Modern Theory o[ Solids, McGraw-Hill Book Co., Inc., Nueva York (1940), capítulo 4. R. A. Smith, Wave Mechanics o[ Crystalline Solids, Chapman & Hall, Ltd., Londres (1961), capítulo 1O. J. Tauc, Photo-and Thermoelectric E[[ects in Semiconductors, Pergmon Press, Oxford (1962).

CAPITULO

8

Teoría cuántica de los electrones en recles periódicas

8.1

INTRODUCCION

La teoría del electrón libre de los metales, desarrollada en el capítulo anterior, se basa en la idea de que los electrones de conducción dentro de una substancia metálica actúan como las partículas libres clásicas de un gas, sometidas sólo a las limitaciones de la estadística de Fermi-Dirac. Desde el punto de vista de la mecánica cuántica, no es evidente por qué debe suceder esto. Tampoco es evidente por qué algunas substancias tienen gran cantidad de electrones libres y, por tanto son muy buenas conductoras, mientras que otras apenas tienen algunos y se comportan como aisladores. El punto de vista más sencillo de la mecánica cuántica r<"specto a un electrón . contenido en un cristal, es el de un solo electrón que se encuentra en un potencial perfectamente periódico que tiene la periodicidad de la red. En este modelo de un solo electrón de un sólido, el potencial periódico se puede considerar como resultado de la distribución periódica de carga asociada con los núcleos iónicos situados en los puntos reticulares, más el potencial "extendido" promedio (constante) aportado por todos los demás electrones libres que pertenecen al cristal, de tal manera que se tiene en cuenta la interacción promedio de un solo electrón con todos los demás. En consecuencia, la solución de la ecuación de Schroedinger para un solo electrón dentro de este potencial, proporciona un conjunto de estados de "un solo electrón" que pueden estar ocupados exclusivamente por un electrón y, de hecho, que pueden estar ocupados (de acuerdo con las limitaciones del principio de Pauli) por todos los electrones del cristal, ya que el electrón único que se consideró inicialmente se puede clasificar como típico de todos los electrones del sistema. La figura 8.1 muestra una representación unidimensional del potencial de un cristal periódico, como el que podría obtenerse siguiendo una trayectoria a lo largo de una de las direcciones ;} 00> de un cristal cúbico con una constante de red a. En lo que respecta a la representación cuántica de un electrón, normalmente se supondrá que la periodicidad del cristal se extiende al infinito en todas las direcciones; pero, por supuesto, en la ruperficie de cualquier cristal real la periodicidad se interrumpe siendo entonces la función del potencial algo semejante a lo que se ilustra en el extremo izquierdo de la figura 8.1. El espaciamiento reticular no será muy uniforme cerca de una superficie de esta naturaleza; pero, como cuestión práctica, generalmente se encontrará que la periodicidad de red es casi perfecta después de unos cuantos espaciamientos Jtómicos dentro del cristal. 231

232

Teoría cuántica de los electrones en redes periódicas

Se descubrirá que las funciones de onda de un ele~trón (denominadas funciones de Bloch) calculadas con el método anterior, siempre tienen ciertas propiedades íntimamente relacionadas con la periodicidad reticular y que las energías electrónicas permisibles ocurren en bandas de estados permitidos que están separados por regiones de energía prohibidas. Dentro de las bandas de energía permitidas se notará que el comportamiento dinámico de los electrones es muy similar al de las partículas libres. La cuestión de si un cristal es un conductor o un aislador, dependerá de si los estados electrónicos dentro de una banda o conjunto de bandas permisibles dadas están llenos por completo o parcialmente vacíos. Además, se verá que el comportamiento colectivo de los electrones dentro de una banda de estados permisibles casi llena, es muy semejante al de unos cuantos portadores de carga positiva en una

Superficie Figura 8.1.

-x

Representación esquemática del potencial dentro de una red cristalina perfectamente periódica. La barrera de potencial de la superficie se muestra a la izquierda.

banda casi vacía. Por tanto, la representación de un solo electrón libre sirve para justificar el modelo del electrón libre desde un punto de vista fundamental y también para contestar a ciertas preguntas difíciles que la teoría del electrón libre por sí sola, ni siquiera podría tratar de explicar. No obstante, debe recordarse que el método del electrón único es una aproximación en la que se omiten completamente los detalles de las interacciones electrón-electrón.

8.2 EL TEOREMA DE BLOCH El teorema de Bloch 1 es una proposición matemática relacionada con la forma de las funciones de onda de un electrón para un potencial perfectamente periódico. Sea una ecuación diferencial de la forma

d21/1 2 dx

+ f(x)ljl(x)

=O

(8.2-1)

1 F. Bloch, Z. Physik 52, 555(1928); los matemáticos han estado familiarizados con el mismo resultado con el nombre de Teorema de Floquet. Por ejemplo, véase E. l. Whittaker y (;.N. Watson, Modern Analysis. Cambrid~~e University Press (1948), página 412.

El teorémo de Bloch

233

en donde f(x) es una función dada que es periódica con un periodo a, de tal manera que f(x +a)= f(x).

(8.2-2)

Si es periódica la función de potencial V(x) para la ecuación unidimensional de Schrodinger de la forma ( 4.8-5), entonces la ecuación de Schródinger será un caso especial de la ecuación (8.2-1). Puesto que (8.2-1) es una ecuación diferencial lineal de segundo orden, (para cualquier valor dado de energía e en 4.8-5) existen dos soluciones independientes g(x) y h(x) tales que

t/J(x)

= Ag(x) + Bh(x)

(8.2-3)

representa la solución más general de (8.2-1). Puesto que f(x+a)=f(x), no sólo g(x) y h(x), sino que también g(x+a) y h(x+a) satisfacen (8.2-1). Sin embargo, .ualquier solución de (8.2-1) se puede expresar como una combinación lineal de g(x) y h(x) de la forma (8.2-3). Entonces, en particular, g(x

+ a)= o: 1 g(x) + o: 2 h(x)

h(x

+ a) = P1 g(x) + P2 h(x)

(8.2-4)

en donde a 1 , a 2 , {3 1 y {3 2 son constantes. Por tanto, tf¡(x +a)= Ag(x +a)+ Bh(x +a)

(8.2-5) Ahora, ¡J;(x +a) siempre se puede expresar en la forma tf¡(x +a)= A.tf¡(x),

(8.2-6)

en donde A es una constante, a condición de que se escoja el valor adecuado para A. Al comparar (8.2-5) y (8.2-3), se observa que si (8.2-6) debe satisfacerse, entonces, . (8.2-7)

Este sistema de ecuaciones homogéneas en A y B tienen soluciones diferentes a A = B =O, sólo si (8.2-8)

La solución de esta ecuación cuadrática en A sirve para determinar los dos valores posibles de A para los que (8.2-6) es cierta. Si se les desigana como A¡ y ;\.2 , tf¡(x +a)= A. 1 t/l(x) tf¡(x

+ a) = A. 2 t/J(x).

(8.2-9)

234

Teoría cuántica de los electrones en redes periódicas Si ahora se definen k 1 'y k 2 de tal modo que (8.2-10)

y se define uk 1(x) y uk 2(x) como uk,(x) = e-ik,xif¡(x)

(8.2-11) si se utiliza (8.2·11), (8.2·9) y (8.2-10), es evidente que

(8.2-12)

La función uk entonces es periódica con un periodo a; de un modo similar esto mismo es aplicable ~ uk 2 (x ). Por tanto, de acuerdo con (8.2-11 ), 1/l(x) puede escribirse siempre en la forma (8.2-13) en donde uk(x) es una función periódica con un periodo a, y en donde k representa ya sea a k 1 o a k 2 tal y como se determinaron antes. Este es el teorema de Bloch y todas las funciones de onda de un electrón para potenciales periódicos se pueden escribir de este modo. En tres dimensiones, el teorema de Bloch se convierte en (8.2-14) Las funciones de onda (8.2-13) y (8.2-14) tienen claramente la forma de ondas planas con un vector de propagación k modulado por una función cuya periodicidad es la de la red cristalina. La función de Bloch (8.2-13) se puede considerar como la manera más general de escribir una solución de la ecuación de Schrodinger que conducr a la misma densidad de probabilidad 1/1* 1/1 en cada célula unitaria del cristal. De acuerdo con (8.2-13), es evidente que en la nésima célula unitaria, debido a la periodicidad de uk,

(8.2-15) De igu?l manera, 1/J*(x

+ na)= e-iknal/l*(x)

(8.2-16)

1/J*(x

+ na)if¡(x + na)= 1/J*(x)if¡(x).

(8.2-17)

y

La función de onda tridimensional (9.3-14) tiene el mismo tipo de comportamiento. En el caso unidimensional, para un cristal infinito, se puede encontrar una solución formal a la ecuación de Schrodinger para cualquier valor de energía e

El modelo de Kronig-Penney de un cristal infinito unidimensional 235 dentro de ciertos rangos, y se tienen dos valores de k correspondientes a cada uno de estos valores de e, por medio de (8.2-8) y (8.2-10). Los valores propios de energía permitidos para dicho sistema, dentro de esos rangos, son continuos. Por otra parte, si el cristal tiene una extensión finita, en cuyo caso, sobre la superficie se deben satisfacer las condiciones físicas apropiadas de frontera, entonces, las soluciones que satisfagan la ecuación de Schrodinger y, a la vez, las condiciones de frontera pueden encontrarse pero, sólo para ciertos valores propios de energía discreta. Puesto que por cada valor propio de energía se tienen sólo dos valores relacionados de k, los valores permisibles de k forman también un conjunto discreto. En este caso, la solución es muy similar a la que se encontró en relación con las vibraciones mecánicas de una red periódica y que se analizó en la sección 3.3. Por supuesto, cuando el número de átomos dentro del cristal se hace demasiado grande, los valores permitidos de e y k, aunque siguen siendo discretos, se amontonan mucho y en la mayoría de los casos se pueden considerar como bandas casi continuas de valores permisibles. Los cristales tridimensionales tienen el mismo comportamiento cualitativo, excepto que en este caso, se tienen más de dos valores permisibles de k para cada valor propio de energía. Por ejemplo, si se imponen condiciones periódicas de frontera a un cristal unidimensional de N átomos (o si se supone que la red tiene la forma de un anillo de N átomos), entonces, si la funcion de onda 1/1 debe tener un solo valor, es necesario (utilizando (8.2-15)) que t/l(x +Na)= eikNatf¡(x)

= t/J(x)

(8.2-18)

.JOr lo cual, eikNa = 1 o bien, 2n:in

eika

= (l)lfN =e--¡¡-

(n = 0,1,2, ·· · N - 1),

(8.2-19)

recordando la forma de las Nésimas raíces de unidad. Si se toma el logaritmo de ambos lados de esta ecuación y se resuelve para k, se encontrará que, en estas condiciones de frontera, los valores posibles de k son 2nn k=n Na

(n

= 0,1,2, ... N).

(8.2-20)

Si N es grande, habrá muchos valores permitidos de k dados por (8.2-20) y, en este caso, se puede considerar que forman un rango casi continuo de valores. Por supuesto, los N valores distintos de k permitidos por (8.2-20) no corresponden al mismo valor de energía. Por cada valor constante de e se tendrán sólo los dos valores permitidos de k dados por (8.2-10).

8.3

EL MODELO DE KRONIG-PENNEY DE UN CRISTAL INFINITO UNIDIMENSIONAL

Para el caso del potencial periódico infinito de un pozo cuadrado unidimensional que se ilustra en la figura 8.2, se puede llegar a una solución exacta de la

236

Teoría cuántica de los electrones en redes periódicas

ecuación de Schródinger. Kronig y Penney 2 fueron los primeros en investigar esta solución y, aunque se relaciona con un potencial periódico algo idealizado que cons· tituye sólo una aproximación burda del que se encuentra en un cristal real, es de gran utilidad porque sirve para ilustrar de un modo más explícito muchas de las características físicas importantes del comportamiento cuántico de los electrones en redes periódicas. Las funciones de onda asociadas con este modelo se pueden calcu· lar con aproximación de un electrón, resolviendo la ecuación de Schrodinger d 2 1/1 dx 2

2m

+ ¡r- (e-

(8.3-1)

V(x)(l/l(x) =O

para un solo electrón dentro del potencial periódico V(x) según se ilustra en la fi.

¡V (x) -Vo

o

u-J 1

U2

Figura 8.2.

--__..,X

a+b~

(celda unitaria) u,(x)

Potencial periódico ideal de pozo cuadrado usado por Kronig y Penney para ilustrar las características generales del comportamiento cuántico de los electrones en redes periódicas.

gura 8.2. Puesto que, de acuerdo con la sección anterior, las funciones de onda deben tener la forma de Bloch, se puede esperar que

(8.3-2) Al substituir (8.3-2) en (8.3-1), se encuentra que la función u(x) debe satisfacer d2u dx2

du

+ 2ik dx-

(

k2 - cx2

+

2m V(x)) ¡¡2 u(x) =O

(8.3-3)

en donde

(8.3-4) Para el potencial de la figura 8.2, se encontrará que (0

2.

R. de L.

Kroni~

< x
y W. G. Penney, Proc. Roy. Soc. Al30, 499 (1931).

{8.3-5)

El modelo de Kronig-Penney de un cristal infinito unidimensional

237

y

( -b <X< 0),

(8.3-6)

en donde u 1 (x) representa el valor de u(x) dentro del intervalo (O<x
(8.3-8)

( -b <X< 0},

'(8.3-9)

en donde A, B, e y D son constantes arbitrarias. Se observará que la cantidad (3 es puramente imaginaria para O< e< V0 . El requisito de continuidad para la función de onda 1/J y su derivada en x = a y x =- b, requiere que la solución u(x) satisfaga estas mismas condiciones, ya que en (8.3-2) eikx es una función apropiada. Si se aplican estas condiciones de frontera (y se recuerda que, dado que u(x) tiene la periodicidad de la red, u 1 (a)= u 2 (- b )), se encuentra que

i(a. -

k)A -

Aei
i(a.-

k)Aei(cx-k)a-

i(a.

i(a.

+ k)B =

i(p - k)e - i(P

+ k)D (8.3-10)

+ Be-i
+ k)Be-i(cx+k)a = i(P- k)ee-i(/1-k)b- i(p + k)Dei(/l+k)b

Por tanto, los coeficientes A, B, e y D se pueden determinar como la solución de un grupo de cuatro ecuaciones homogéneas simultáneas y lineales en dichas cantidades. Por supuesto, no existe ninguna otra solución aparte de A = B = e= D = O, a menos que desaparezca el determinante de los coeficientes. Esto requiere que

1 a.-k

1

1

1

-(a.+ k)

P-k

-(P +k)

ei(cx-k)a

e-i(cx+k)a

e-i(/1-k)b

ei
(a._

k)ei(cx-k)a

-(a.+

k)e-i(cx+k)a

(p _

k)e-i
-(P

=O.

+ k)ei(/l+k)b (8.3-11)

Al expander el determinante, se puede demostrar, después de muchas operaciones algebraicas tediosas, pero directas, que (8.3-11) se puede expresar como

a.2

+ p2

- ·--:¡;¡¡-sen a.a sen Pb

+ cos a.a cos Pb = cos k( a + b).

(8.3-12)

238

Teoría cuántica de los electrones en redes periódicas

Puesto que en el rango (O< e< V0 ), {3 es imaginaria según lo define (8.3-7), para estos valores de energía es más conveniente expresar (8.3-12) en una forma ligeramente distinta. Haciendo que

f3 = iy en esta región y observando que cos ix ción (8.3-12) se puede escribir como sigue

y2 - a2 - 2- - senh yb sen aa ay

(8.3-13)

= cosh x

y sen ix

= i senh x,

+ cosh yb cos cxa = cos k( a + b),

la ecua-

(8.3-14)

en donde 'Y es una cantidad real positiva en el intervalo (O< e< V0 ), al igual que {3 lo es en el intervalo (V0 <e<""). En consecuencia, es más conveniente usar (8.3-12) cuando (V0 <e
(8.3-15) en donde tan éJ

=-

a2

+ {32 2af3 tan flb

CVo <e< oo)

y

[1 +

(a2

+ /)2

4a 2 y2

rn clonde tan <5 =

senh 2 yb a2

+ y2 2ay

]

1/2

cos(aa - <5) = cos k(a

tanh yb

(O< e< V0 ).

+ b),

(8.3-16)

El modelo de Kronig-Penney de un cristal infinito unidimensional

239

De acuerdo con estas expresiones, es evidente que en ambos casos, el lado izquierdo tiene la forma de una función coseno por un factor de modulación cuya amplitud es invariablemente mayor que la unidad. El valor de este factor de modu· !ación en realidad, es un máximo para a= O (y, por tanto, para e= O), y se acerca a la unidad en el límite de las energías grandes, en donde a ~ (3. Cuando los lados izquierdos de (8.3·15) y (8.3-16) se grafican como una función de la energía, en cuyo caso se debe observar a partir de (8.3-4) y (8.3-7) que (8.3-17) los resultados son como se ilustra en la figura 8.3. En esta figura, el lado izquierdo de (8.3·15) o (8.3-16) aparece graficado en función de la energía. Cuando la orde·

f(•)

+,.

k==-

o+b

Figura 8.3.

Gráfica de las funciones del lado izquierdo de (8.3-15) y (8.3-16) en función de la energía. Las regiones sombreadas señalan las bandas de energía prohibidas en donde el valor de k es complejo, las regiones no sombreadas son las bandas de energía permisibles correspondientes a valores reales de k.

nada de la curva está entre + 1 y - 1, existe un valor real para k correspondiendo a funciones de onda físicamente posibles. No obstante, fuera de estos límites, k debe ser compleja con una parte imaginaria diferente a cero. Estos valores de k nunca pueden producir funciones de onda con un significado físico; los rangos de energía correspondientes están prohibidos y se ilustran en la figura 8.3 como las regiones sombreadas. Por tanto, se tienen regiones alternas de valores propios permisibles y regiones prohibidas. Estas regiones se denominan casi siempre bandas de energía permisibles y prohibidas y el agrupamiento de los valores de energía permisibles en estas bandas es una de las características típicas más importantes del comporta· miento de los electrones en redes periódicas. Se puede demostrar que las bandas de energía que tienen los mismos aspectos cualitativos que los que se indican en la figura 8.3, se forman sea cual fuere la forma detallada del potencial, siempre y cuando sea periódico.

240

Teoría cuántica de los electrones en redes periódicas c(k)

1 1

1 1 1 1

1

/-Partícula libre 1 (e= ·Pk 212m l 1

A

'i

l\

1\

1 1 1 1

1

1 1 1

1 1 1

1 1

1 1

1- k(•ol

lk(•ol

-3,.

o•b

Figura 8.4.

•o

1 1

\

La energía

-2,. o•b €

~

o•b

o

_!!_

o•b

k

o+b

_k o+b

-*

..1!_ o+b

graficada como una función de k de acuerdo con (8.3-15) y (8.3-16).

Si se usan (8.3-1 5), (8.3-16), (8.3-4) y (8.3-7), se puede grafic:.~r una curva que presente a la energía e como una función de k. En la figura 8.4 se muestra el resultado de una manera esquemática. Las bandas de energía prohibidas y la relación de e en función de k dentro de las diferentes bandas permitidas, se han asignado de acuerdo con el patrón que aparece en la figura 8.3. Puesto que cos- 1 k(a + b) n0 es una función de un solo valor, esta asignación es necesariamente arbitraria. Para energías grandes, es aparente que la función e(k) se acerca a la relación del electrón libre e= h2 k 2 /2m (que se ilustra con la curva punteada de la figura 8.4) de un modo muy semejante dentro de las bandas permitidas. Así también, para energías grandes, se ha encontrado que las bandas permitidas se hacen muy anchas y las regiones prohibidas muy angostas. No obstante, la curva e(k) siempre tiene una pendiente cero en los bordes de las bandas permisibles, es decir, cuando k = ± mr/ (a+ b), siendo n un entero. Este resultado se puede corroborar mediante la derivación directa de (8.3-1 S) y ( 8.3-16); pero aquí no se verán los detalles de estos cálculos. Esta característica de la curva e(k) es muy general y se puede demostrar que se presenta incluso en el caso tridimensionaL independientemente de la forma matemática precisa de la función de potencial.

8.4

CANTIDAD DE MOVIMIENTO DEL CRISTAL Y MASA EFECTIVA

forma

Si la función uk(x) de (8.2-13) es una constante, la función de onda tiene la e±ikx correspondiente a un electrón perfectamente libre cuya cantidad de

Cantidad de movimiento del cristal y moSil efectiva

241

movimiento es p = ± lik y cuya energía, de acuerdo con los resultados de la sección 4.9, sería (8.4-1) En la figura 8.4 se ilustra esta relación por medio de la curva punteada. Para valores grandes de e, la relación real e en función de k se acerca mucho a esta relación. De acuerdo con (8.2-13) y los resultados de la sección anterior, es evidente que k es una constante del movimiento, que lik tiene las dimensiones de una cantidad de movimiento y que al aumentar la energía del electrón (haciéndose, por ende. la partícula mucho más "libre"), los valores de k se aproximan en general a los de la cantidad de movimiento de la partícula libre dividido.; entre h. Se puede ver con facilidad que estas conclusiones se deben aplicar sea cual fu~re la forma partícular que adquiera el potencial periódico. Por tanto, se acostumbra referirse a lik corno la cantidad de movimiento del cristal y, corno se verá en breve, sucede en muchos casos que el comportamiento dinámico del electrón dentro de la red cristalina, con respecto a la cantidad de movimiento del cristal, es muy similar al de una partícula libre con respecto a la cantidad de movimiento real. Para que quede perfectamente clara la diferencia entre la cantidad de movimiento real y la cantidad de rnovi.Jnjento del cristal, se debe observar que debido a la presencia del potencial de red, la cantidad de movimiento real instantáneo de un electrón no es en absoluto una constante del movimiento y no se calcula directamente por métodos de la mecánica cuántica, excepto corno un valor promedio, en tanto que para un estado de energía dado, la cantidad de movimiento del cristal lik es un valor constante perfectamente bien definido al igual que lo es la cantidad de movimiento real de una partícula libre de cierta energía. Ahora se verá el movimiento de un electrón dentro de un cristal bajo la influencia de un campo eléctrico aplicado. Para comprender mejor el movimiento de un electrón en esta situación, se deberá localizar la función de onda superponiendo soluciones que tienen distintos valores de k, corno se hizo en la sección 4.9. Si se hace esto, la velocidad de grupo asociada con el "paquete de ondas" del electrón, es

Vg =

en donde, por supuesto, Planck e= :liw. Supóngase electrón, que adquiere un tiempo dt. Entonces, si se

dw 1 de dk = h dk'

(8.4-2)

e y w tienen una conexión a través de la relación de que hay un campo eléctrico externo E que actúa sobre el incremento en velocidad dvg en una distancia dx, en un usa (8.4-2), se observa que

de eE de de=-dk= -eEdx= -eEv dt= - - - d t dk g li dk '

(8.4-3)

de donde, eE

(8.4-4)

dk= --dt li ' o bien,

dk dp li - = - = -e E dt dt

=F

'

(8.4-5)

242

Teoría cuántica de los electrones en redes periódicas

en donde ahora se tiene el símbolo p para denotar la cantidad de movimiento del cristal. La ecuación (8.4-5) indica que la capacidad de cambio respecto al tiempo de la cantidad de movimiento del cristal es igual a la fuerza - eE. Por tanto, es análoga a la ley de Newton, que demuestra que la cantidad de movimiento del cristal del electrón en una red periódica cambia bajo la influencia de un campo aplicado, en la misma forma que lo hace la cantidad de movimiento real de un electrón libre en el vacío. Si se deriva la expresión (8.4-2) con respecto al tiempo, el resultado es (8.4-6) que, usando (8.4-5), se puede escribir como sigue (8.4-7)

en donde la masa efectiva m* está dada por (8.4-8) La expres10n (8.4-7) es fundamentalmente la ecuac10n de fuerza, de Newton. El factor de proporcionalidad que relaciona a la fuerza eE y a la aceleración dgg/dt se puede considerar como la masa efectiva del electrón. Sin embargo, la masa gravitacional real del electrón no se relaciona directamente con la masa efectiva; se trata de la cantidad d 2 e/dk 2 que es el factor importante. Si el electrón en realidad es libre, entonces e y k se relacionan por medio de (8.4-1) y (8.4-8) se reduce a m*= m. Si la energía es una función parabólica de k, que tiene la forma (8.4-9) entonces, la masa efectiva tiene un valor constante m*= h2 /2C y el comportamiento dinámico del electrón será el mismo que el de una partícula libre con esta masa efectiva. Si la energía no es una función parabólica de k, entonces dicha masa no será constante con la energía y el comportamiento dinámico será el de una partícula de masa variable complicándose con ello la situación. En cualquier caso, para una primera aproximación, todo el efecto del potencial del cristal periódico reside en substituir la masa del electrón libre por una masa efectiva. Afortunadamente, la relación que asocia a e con k es casi siempre parabólica o casi parabólica sobre el rango de energías accesible a un electrón dentro del cristal. De acuerdo con la figura 8.4, parece ser que la curva e en función de k tiene siempre una forma parabólica en la base y la parte superior de las bandas de energía permisibles. Sin embargo, incluso cuando los electrones del sistema están en otras regiones, lo importante es que la masa efectiva sea fundamentalmente constante sobre un intervalo de energía, del orden de la cantidad promedio de energía que una partícula puede adquirir o perder en un solo evento de dispersión, o entre varios eventos de dispersión en un tiempo del orden del tiempo de relajación. Esta cantidad de energía es del orden de kT No obstante, a 300°K, kT representa sólo 0.025 eV, y la anchura total de una banda de energía que puede desempeñar un papel importante en los procesos de transporte en substancias cristalinas típicas es

Representación de zona reducida; electrones y huecos

243

mucho mayor que esto casi siempre del orden de 1 eV. En eventos de dispersión independientes o en intervalos entre eventos de dispersión sucesivos, un electrón estará confinado casi siempH~ dentro de un corto segmento de la curva E en función de k, que casi siempre se puede considerar como aproximadamente parabólico. Esto hace ver que la representación del electrón libre en un metal está justificada en su mayor parte, y la única corrección importante es que la masa del electrón libre debe substituirse en todos los casos por una masa efectiva apropiada relacionada con la forma de la curva E en función de k, por medio de (8.4-8). En consecuencia, se llega a la conclusión de que todos los resultados derivados en el capítulo 7 basándose en la teoría del electrón libre, son correctos a condición de que la masa del electrón se substituya con la masa efectiva apropiada. La masa efectiva se puede deducir por comparación de los datos del calor específico electrónico que se han obtenido a través de la experiencia, con el resultado del electrón libre dado por la ecuación (7. 7-25); también se puede L alcular desde el punto de vista de la mecánica cuántica principiando con las funcione~ de onda atómicas autoconsistentes para los átomos del cristal, que luego se combinan para dar un potencial de cristal apropiado para la substancia en cuestión. Los valores calculados de este modo concuerdan casi siempre con los que se determinan de un modo experimental. Para la mayoría de los metales, la masa efectiva varía entre la mitad y el doble de la masa del electrón libre, aunque para muchos metales de transición es mucho mayor y para ciertos compuestos del tipo III-V puede ser mucho menor.

8.5

REPRESENTACION DE ZONA REDUCIDA; ELECTRONES Y HUECOS

En la figura 8.3 se ilustra la asignacwn de rangos de valores para k dentro de cada banda de energía permitida, lo cual produce la curva que aparece en la figura 8.4. Puesto que el único requisito que se debe llenar dentro de cada banda es que - 1 .:;;; cos k(a + b) .:;;; + 1, es evidente que esa asignación de valores para k a cada banda no es única. La ventaja de la asignación ilustrada en la figura 8.3 es que lleva a lo que se llama representación extendida de la figura 8.4, en la que es muy evidente la relación con la curva de la partícula libre E en función de k. Sin embargo, se podría trasladar cualquiera de los segmentos de la curva que aparece en la figura 8.4, a la derecha o a la izquierda, en forma paralela al eje k y a una distancia 2mr/(a + b), en donde n es un entero y se seguirán satisfaciendo las relaciones (8.3-15) y (8.3-16), ya que cualquier transformación de esta índole no varía el valor de cos k( a + b ). A veces es muy útil hacer una transformación particular de este tipo trasladando los diferentes segmentos de la curva E en función de k a la derecha o la izquierda, en forma paralela al eje k y a distancias que son múltiplos enteros de 2n/(a+b), de tal manera que todos queden dentro del intervalo -nf(a+b)
244

Teoría cuántica de los electrones en redes periódicas dk)

_,._ O+b

Figura 8.5. Representación esquemática de la gráfica de € en función de k, de la figura 8.4, transformada a la representación de zona reducida.

red en estas circunstancias. En una sección posterior se ampliarán los conceptos relacionados con este tema. En el cristal infinitamente grande de la sección 8.3, las energías permitidas forman un continuo de valores dentro de las bandas permisibles. Sin embargo, si el cristal tiene una extensión finita y contiene un total de N átomos, ya se vio, de acuerdo con (8.2-20), que por el contrario, sólo se tendrán N estados propios permisibles específicos de la cantidad de movimiento del cristal k dentro de cada banda de energía permisible. De acuerdo con la figura 8.4, se puede ver que para una energía dada e0 , los dos valores de cantidad de movimiento de cristal permisibles son k(e 0 ) y - k(e 0 ). Desde el punto de vista físico, el primero representa un estado en el que un electrón se mueve hacia la derecha con la cantidad de movimiento positivo del cristal k(e 0 ), en tanto que el segundo representa un estado en el que un electrón se desplaza hacia la izquierda con una cantidad de movimiento del cristal igual y opuesta. Evidentemente, la energía es la misma en ambos casos. El efecto del espín de electrón, en este caso, al igual que en sistemas atómicos aislados, es duplicar el factor de degeneración asociado con todos los niveles de energía del sistema, ya que se debe considerar que cada estado cuántico se ha dividido en dos alojando uno de ellos a un electrón con "espín ascendente" y el otro, un electrón con ''espín descendente". Entonces, cuando se incluye el efecto del espín electrónico, se debe llegar a la conclusión de que dentro de cada banda de energía permisible del sistema se tienen exactamente 2N estados cuánticos. A una temperatura de cero absoluto, los electrones del sistema ocuparán estos estados, uno por cada estado, como lo requiere el principio de exclusión de Pauli, a partir del estado más bajo y en forma ascendente, hasta una energía dada que se determina mediante el número de estados disponibles, su distribución de energía y el número de electrones del cristal. Por supuesto, esta energía es la de Fermi del cristal a la temperatura cero. En un cristal unidimensional, algunas de las bandas permisibles estarán totalmente llenas, algunas completamente vacías y otras llenas sólo en

Representación de zona reducida; electrones y huecos

245

parte. 3 Si se aplica un campo eléctrico, es evidente que las bandas vacías no podrán aportar ninguna corriente; sin embargo, también es cierto que no se puede obtener una corriente de las bandas llenas. Esto se puede comprender observando que la densidad de corriente que se produce en una banda dada será (8.5-1) en donde ¡:; es la velocidad promedio y n 0 el número de electrones por unidad de volumen pertenecientes a dicha banda. No obstante, v se puede expresar como sigue (8.5-2) en donde la suma se toma de todas las velocidades a,.ociadas con los electrones individuales dentro del volumen V del material. Por tanto, si se usa (8.5-2), la expresión (8.5-1) se puede escribir como (8.5-3) Sin embargo, esto debe dar cero cuando se suma sobre una banda completa, ya que debido a la simetría de las curvas de la figura 8.4 o la figura 8.5, alrededor del eje E( k) por cada estado de velocidad positiva h- 1 aEjak correspondiente a un punto de pendiente positiva, existe un estado correspondiente a una velocidad negativa de igual magnitud (con pendiente negativa) en k'=- k. Se debe llegar a la conclusión de que sólo las bandas que están parcialmente llenas pueden aportar un flujo de corriente. Esto se comprende desde un punto de vista físico observando que en la banda parcialmente llena existen siempre electroneo que se pueden excitar gradualmente a estados desocupados de mayor energía y cantidad de movimiento, mientras que en una banda llena, debido al principio de exclusión de Pauli, esta excitación gradual de campo no puede ocurrir jamás debido a que todos los estados están ya ocupados. Un solo electrón en reposo en una banda vacía. ocupará el estado de energía más bajo en la base de dicha banda, en ausencia de una excitación térmica, como se puede ver en la figura 8.6. Si ahora se aplica un campo eléctrico E 0 al cristal, el electrón experimentará una fuerza - eE0 y se excitará gradualmente a través de estados de energía siempre creciente y cantidad de movimiento (negativa), adquiriendo una cantidad de movimiento cada vez mayor en la dirección - x, de acuerdo con (8.4-5). De acuerdo con las predicciones de la teoría expuesta en las secciones 8.2-8.4, este proceso seguirá excitando al electrón a través de energías sucesivamente más altas, hasta que llegue a la parte superior de la banda en x = rrfa, en donde a es el espaciamiento reti~.ular. Puesto que los puntos x = rrfa y x = - rrfa son equivalentes, se puede considerar que el electrón "reaparece" en x = rrfa, disminuyendo su energía a lo largo de la porción derecha de la curva conforme k va de rr/a a cero, llegando al punto inicial en el que todo el proceso se repite. En estas circunstancias, el movimiento del electrón es oscilatorio (oscilación de Zener). Es importante observar que no existe un mecanismo inherente a la teoría de las secciones 8.2-8.4 que sirva para limitar este movimiento; más bien, éste continuará de un modo indefinido de acuerdo con la teoría aquí delineada. Si el potencial fuera 3 La situación en los sistemas bidimensionales y tridimensionales es más complc1a. Fn estos casos, la energía de diferentes bandas se puede superponer y más de una banda puede estar parcialmente llena. Estos sistemas se estudiarán Pn detalle más adelante.

246

Teoría cuántica de los electrones en redes periódicas r(k)

----•w+-----~~~----_,~-k

o

Figura 8.6.

Un electrón que se encuentra cerca de la base de una banda permisible, sujeto a fuerzas que tienden a acelerarlo a lo largo de la dirección -x.

perfectamente parabólico en lugar de tener la forma que se ilustra en la figura 8.6, el electrón adquiriría una velocidad y energía ilimitadas. Entonces, se debe llegar a la conclusión de que en cualquiera de los casos, el movimiento de un electrón libre dentro de un potencial perfectamente periódico se realiza sin que lo impida la red, en el sentido de que no se registran procesos de dispersión que detengan o aleatoricen la velocidad de un electrón, y que se relacionen con la misma Sin embargo, si existe una desviación de la periodicidad perfecta de la red, este resultado no se puede aplicar. En este caso existirá siempre la probabilidad de una transición aleatoria repentina a un estado relacionado con otro valor de k dentro de la banda. En promedio, estas transiciones aleatorias hacen que el electrón regrese a k = O y se puede decidir que existe un proceso de dispersión asociado con el hecho de que el potencial de red se aleja de la periodicidad perfecta. Esta desviación se puede deber al hecho de que la red puede encontrarse a una temperatura superior al cero absoluto, en cuyo caso las vibraciones térmicas que se establecen introducen una leve aperiodicidad y las posiciones instantáneas de los átomos ya no coinciden con precisión con la red periódica de sus posiciones de equilibrio. Esta situación se puede analizar de acuerdo con una representación en la que los electrones se ven dispersados por acción de los fonones. La desviaciones de la periodicidad pueden causarse también por la presencia de átomos de impureza así como por vacíos de red, átomos intersticiales dislocaciones y otros defectos estructurales de la red cristalina. Estos efectos dan como resultado los fenómenos de la dispersión de red, dispersión de impurezas y dispersión de defecto que se vieron en el capítulo anterior. El estudio de los aspectos cuantitativos de estos procesos se pospondrá hasta un capí· tulo subsecuente. Estos procesos de dispersión hacen que el comportamiento de oscilación de Zener no se presente jamás en la práctica. 4 Lo que en realidad sucede en todas las situaciones experimentalmente factibles, es que un electrón que principia en O de la figura 8.6, se acelera como lo describe la teoría de las secciones 8.2-8.4, hasta que llega a un punto A a una pequeña distancia a lo largo de la porción parabólica inferior de la curva. Su compartimiento en este rango es el de un electrón libre de masa m*, como lo establece (8.4-8). En el punto A se ve dispersado por uno de los mecanismos antes descritos, llegando en promedio nuevamente a O, en donde se

4 Se puede encontrar un estudio cuantitativo de la oscilación de Zener en E. Spenke, Electronic Scmiconductors, McGraw-Hill Book Co., Inc., Nueva York (1958), páginas 229, 257.

Representación de zona reducida; electrones y huecos

247

repite el ciclo. Entonces, el comportamiento es el de una partícula libre sujeta a procesos de dispersión que se acaban de ver en el último capítulo, lo cual conduce a la ley de Ohm, la conductividad térmica, el efecto termoeléctrico y todos los demás resultados de la teoría del electrón libre de los metales, y la única diferencia es que la masa del electrón se substituye por la masa efectiva en todos los procesos. La distancia OA de la curva de e en función de k, de la figura 8.6, se ha exagerado para facilitar la comprensión; pero en la mayoría de los casos que se presentan en la práctica es mucho más pequeña. Para una banda que contiene un número relativamente pequeño de electrones, la corriente obtenida cuando se aplica un voltaje pequeño está dada por (85-3) sumada sobre todos los electrones de la banda. Sin embargo, si la banda está casi llena y se tienen sólo unos cuantos estados vacíos (que en el estado de equilibrio se concentran cerca de la parte superior de la banda), 5 la ecuación de la corriente (8.5-3) se expresa mejor escribiéndola en la forma (8.5-4) En este caso, la suma sobre i representa la adición sobre todos los estados de velocidad ocupados por los electrones, la suma sobre ¡ representa la adición sobre todos los estados de velocidad dentro de la banda y la suma sobre k representa la adición sobre todos los estados de velocidad desocupados. Como se vio antes en relación con (8.5-3), la suma sobre j, tomada sobre todos los estados de la banda, debe desaparecer. La suma restante sobre los estados desocupados corresponde a una corriente que podría producirse por un número correspondiente de portadores de carga posztivos. Se puede (y es conveniente, como se verá más tarde) expresar la corriente de una banda casi llena, como derivada del movimiento de un número comparativamente pequeño de estados electrónicos vacíos o huecos, que se comportan corno partículas positivas, más que mediante un gran número de electrones. La velocidad asociada con un hueco es la que tendría un electrón si ocupara un estado de energía vacío que normalmente se encuentra en la parte superior de la banda de energía. Sin embargo, puesto que la relación de e en función de k es cóncava hacia abajo, d 2 ejdk 2 es negativa y da una masa electrónica efectiva negativa a partir de (8.4-8). Una partícula con masa efectiva negativa experimenta una aceleración en una dirección opuesta a la de la fuerza aplicada. Una partícula negativa con una masa efectiva negativa entonces se acelerará en la misma dirección que el campo aplicado y presentará el mismo comportamiento dinámico que una partícula positiva de masa positiva. Por tanto, la situación de una banda casi llena se puede considerar como un caso en que se abarca un número relativamente pequeño de partículas positivas de masa positiva, que se designará como huecos, cuyas velocidades y cantidades de movimiento corresponden a los estados electrónicos desocupados dentro de la banda. En un capítulo posterior se verá que en ciertos materiales, la naturaleza física y el comportamiento dinámico de los huecos se comprenden con más facilidad relacionándolos con los defectos en los enlaces electrónicos de valencia que unen a los átomos más cercanos y proporcionan las fuerzas de cohesión que mantienen unido al cristal.

S En una banda parcialmente vacía, los electrones ocupan los estados de energía más bajos disponibles en ausencia de una excitación térmica. Esto es aplicable también a la banda casi llena, en donde el resultado es que los estado vados se localizan en la parte superior de la banda. Por tanto, en una banda casi completamente llena, los estado~ vacíos '·gravitan" ascendentemente en un diagrama como el de la figura 8.5, en el que la ordenada representa la ener~ía de un electrón.

248

Teoría cuántica de los electrones en redes periódicas

No se analizará detalladamente el comportamiento de los electrones y los huecos bajo la influencia de la fuerza magnética; pero se puede demostrar6 que se mueven como lo harían partículas negativas o positivas de masa efectiva m*, según lo que establece (8.4-8), bajo la influencia de la fuerza magnética normal q(v x B)/c.

8.6

LA APROXIMACION DEL ELECTRON LIBRE

En las secciones anteriores se vio cómo un modelo particular de potencial periódico (que se ilustra en la figura 8.2) condujo a la formación de bandas de energía permisibles y a una relar;ión de e en función de k de la forma que aparece en la figura 8.4. La forma de esta relación fue tal que la cantidad hk se podí::. considerar ventajosamente como una "cantidad de movimiento del cristal" en cuyos términos se podía explicar de un modo sencillo la dinámica de los electrones en los campos de fuerza aplicados. La representación resultante del comportamiento electrónico fue muy similar al del electrón libre del capítulo 7, excepto que la masa del electrón libre se substituía por una masa efectiva y que los portadores de carga en una banda casi llena tenían que considerarse como huecos positivos. Se dio énfasis al hecho de que estas conclusiones cualitativas son independientes de la forma precisa de la función de potencial, siempre y cuando sea periódico; se adoptó la función de potencial de la figura 8.2 sólo con fines ilustrativos, ya que permitía una solución exacta de la ecuación de Schrodinger. En cristales reales, la función de potencial que se utiliza debe estar relacionada de .algún modo con el potencial real experimentado por un electrón, debido a los núcleos iónicos y a todos los demás electrones del cristal. Una solución exacta de este problema, incluso en la aproximación de un sólo electrón, sería imposible de lograr, por tanto, se acostumbra a plantear el problema desde el punto de vista de la aproximación del electrón libre o la aproximación de enlace firme, cualquiera que sea el más apropiado para la situación particular de que se trate. En la aproximación del electrón libre, se supone que la energía total del electrón es siempre grande en comparación con la energía potencial periódica. En estas condiciones, las bandas permisibles serán anchas y las regiones de energía prohibida muy angostas. Estas circunstancias nunca se realizan a la perfección en cristales reales, dado que el potencial va siempre a - oo en los núcleos iónicos; pero para los electrones más externos de muchos metales simples, incluyendo los alcalinos, los requisitos se satisfacen aceptablemente en casi todo el volumen del cristal. Si se adopta un modelo de potencial cristalino unidimensional para una mayor facilidad, y el potencial periódico V(x) se escribe en la forma (8.6-1)

en donde f(x) tiene la periodicidad de la red, la ecuación de Schrodinger (8.3-1) se puede escribir como sigue

d 2 ~ +(k~+ yf(x))rf¡(x) =O.

(8.6-2)

dx

6 R. A. Smith, Wave Mechanics o[ Crystalline Solids, John Wiley and Sons, Nueva York (1961, página 458)

La aproximación del electrón libre

249

en donde k 0 está relacionada con la energía total e por medio de

(8.6-3) Puesto que f(x) es periódica, se puede expresar como una serie de Fourier de la forma 00

¿

f<x rel="nofollow">=

c.e-2"i•xta

(8.6-4)

n=- oo

siendo

c.= ~fa f(x)e2"inx/a dx, a o

(8.6-5)

en donde a es la constante de red del cristal. De acuerdo con (8.6-1), es evidente que los coeficientes Cn se relacionan con los coeficientes de expansión de Fourier del potencial periódico propiamente dicho a través de

(8.6-6) en donde Vn se relaciona con los coeficientes de expansión de Fourier de V(x). Puesto que las funciones de onda deben tener la forma de Bloch eikxuk(x), y, dado que uk(x) debe ser una función periódica con un periodo a, expresable como una serie de Fourier, se puede escribir

uk<x>

=

00

¿

b.e-2"i•x/a

(8.6-7)

n=- oo

tf¡(x)

= eikxuk(x) = eikx ¿ •

b.e-2ninx/a.

(8.6-8)

Para electrones perfectamente libres, -y= O y las soluciones se convierten en funciones ondulatorias de partícula libre de la forma

(8.6-9) En este límite uk(x) ~ b 0 y k~ k 0 , de tal modo que en el caso general, se debe esperar que todos los valores de bn, excepto b 0 , se acerquen a cero conforme -y tiende a cero. En consecuencia, se puede escribir una expresión aproximada para la función de onda de la forma

(8.6-10) que puede esperarse sea válida para valores pequeños de -y (es decir, para las condiciones delineadas antes y de acuerdo con las cuales la aproximación del electrón libre es válida). Es fácil ver que esta función de onda tiene la forma de Bloch, en donde uk está dada por

uk<x> = bo +Y¿ b.e-2"i•xla. ... o

(8.6-11)

250

Teoría cuántica de los electrones en redes periódicas Al substituir (8.6-10) en la ecuación de Schrodinger (8.6-2), se obtiene bo(k~ - k 2 )eik:J:

+ y L [(k~ .... o

k~)b,.

+ b0 c,.]eik"x (8.6-12)

en donde

k =k_ 2nn n

(8.6-13)

a

Puesto que el interés reside en la solución dentro del límite en donde 'Y-+ O, como primera aproximación se puede hacer caso omiso del término -y 2 de ( 8.6-12); entonces, multiplicando la ecuación completa por e-ikmx, integrando sobre la célula unitaria desde x = O hasta x = a, se tiene que

b 0 (k~ -

k 2 ) fa e2"imx/a dx o

+ y L {[(k~ - k~)b,. + boc,.] .... o

X fa é"i(m-n)x/a

Jo

dx} =O.

(8.6-14)

Si m = O, la segunda integral desaparece para todos los valores de n en la suma, por lo cual or

(8.6-15)

mientras que si m =1= O, la primera integral se desvanece y la segunda da cero, excepto cuando n = m, en cuyo caso se obtiene

o bien, (8.6-16)

Entonces, a este orden de aproximación, de acuerdo con (8.6-15) y (8.6-3), la relación entre e y k es la misma que la de una partícula libre. La función de onda se obtiene substituyendo los valores (8.6-16) en lugar de bn en (8.6-10), de donde. (8.6-17)

De acuerdo con (8.6-15) la corrección de primer orden para la energía de partícula libre que se origina desde el potencial periódico es cero. La corrección de energía de segundo orden se puede obtener reteniendo el término 'Y2 en (8.6-12). Al multiplicar (8.6-12) por e-ikx e integrando desde x =O a x =a, se obtiene

(8.6-18)

La aproximación del electrón libre

251

La primera integral anterior es cero para todos los valores permisibles de n, en tanto que la segunda integral es cero a menos que n =- n'. Por tanto, la ecuación se reduce a (8.6-19)

Si f(x) está dada como una serie de Fourier por medio de (8.6-4), entonces, al substituir n por - n, 00

f(x)

= :¿

c_"e2ttinxta,

(8.6-20)

n=- oo

en tanto que, tomando el conjugado complejo de ambos lados de (8.6-4) y observando que puesto que f(x) es una función real, .f'(x) = f(x) se puede escribir también 00

f<x> =

:¿

c:e2ninxta.

(8.6-21)

n=-oo

Puesto que los coeficientes de Fourier asociados con la representación de una función dada son únicos, se debe tener (8.6-22)

Usando la expresión de la primera aproximación (8.6-16) para los coeficientes bn y la relación (8.6-22), la expresión (8.6-19) se puede escribir en la forma

(8.6-23)

Si se usa (8.6-3) y (8.6-6) para expresar este resultado en función de e y Vn, se puede demostrar fácilmente que

(8.6-24)

Estas soluciones son satisfactorias sólo a condición de que k 2 no se acerque a uno de los valores k~. Si k 2 ~k~ para algún valor de n, una de las cantidades k 2 - k~ de los denominadores de los términos de suma de (8.6-17) tenderán a cero y dicho término seguirá siendo muy grande a pesar de que r sea muy pequeño. En este caso, la expresión supuesta (8.6-1 O) no es una buena aproximación para la función de onda y se debe emplear otra forma. Entonces, si k 2 ~k~, k =

± kn =

2nn

±k :¡: - . a

(8.6-25)

252

Teoría cuántica de los electrones en redes periódicas

Para el signo superior, esta ecuación da n =O, que se excluye de (8.6-17) en cualquier caso y, por ende, no tiene ningún interés particular. Para el signo inferior se obtiene

k=

mt

(8.6-26)

a

que, puesto que n puede tomar valores positivos y negativos, se refiere a todos los puntos de borde de la banda. Será necesario utilizar un planteamiento por separado para valores de k en las cercanías de estos puntos. Supóngase ahora que k~ mrfa, de donde kn =k- (2rrnfa) ~- nrrfa. Por tanto, k~~ k 2 y bn será muy grande de tal modo que en (8.6-17) la cantidad rbn ya no será pequeña aunque r sea pequeña. En este caso se puede escribir la función de onda aproximadamente como (8.6-27) considerando que los otros términos de la suma de (8.6-17) son despreciables en comparación con el nésimo. Puesto que kn = - k en el borde de la banda, esta función de onda (8.6-27) es una superposición de una onda que se propaga a lo largo del eje positivo x y otra que se propaga en dirección opuesta; por tanto, tiene el carácter de una onda estacionaria. Esta situación física concuerda con el punto de vista de que la función de onda del electrón sufre una reflexión de Bragg en k = ± mrfa. Si la función de onda (8.6-27) se substituye en la ecuación de Schrodinger (8.6-2), utilizando (8.64), se obtiene

Al multiplicar (8.6-28) por e-ikx y al integrar desde x =O hasta x =a, se puede ver fácilmente que los términos segundo y tercero no contribuyen con nada y que se obtiene una contribución del cuarto término sólo cuando n' = - n; el resultado final de esta operación es, entonces,

·

De igual manera, al multiplicar (8.6-28) por e-•k"x = e do como antes, se puede demostrar que

"")x

-i(k- 2

a

e integran·

Las dos ecuaciones anteriores se p01eden considerar como un conjunto de ecuaciones homogéneas que determinan a b 0 y bn. Como tales, las soluciones diferentes a bo = bn =O existen sólo si desaparece el determinante del sistema, es decir, sólo si

1 1

k o2 - k2

c.

y 2 c.*

1-

2

2

2

2

2

*

k2 _ k2 - (ko - k )(k 0 -k.)- y c. c.= O. O

n

(8.6-31)

La aproximación del electrón libre

253

Esta ecuación es cuadrática en k~ y se puede resolver en la forma acostumbrada para dar (8.6-32)

que, utilizando {8.6-3), (8.6-16) y {8.6-13), se puede expresar como sigue 2

s(k) = 4ñm [ k 2

2nn) ± + ( k - --¡;-

En el borde de la banda k

2

=k

J( ( k2

71

-

k-

2nn) --¡;-

2 2 )

+ (4miY.I) -¡;r

2

]

.

(8.6-33)

= mrfa, y, en estos puntos, (8.6-33) se reduce a

(8.6-34)

en donde Bn

=~ (~) 2 2m a

(8.6-35)

representa la energía de partícula libre asociada con los puntos de borde de la banda. De acuerdo con los resultados de la sección 8.3, se sabe que en los puntos de borde de la banda k=± mrfa, se produce una reflexión interna de Bragg que va acompañada de una discontinuidad o "vacío de energía" en la curva de e en función de k. 7 De acuerdo con esto, debe interpretarse que la ecuación (8.6-34) implica un vacío de energía o banda prohibida con una anchura 21Vn l, en donde Vn es el nésimo coeficiente de Fourier en la expansión de serie de Fourier del potencial reticular periódico. Para valores de k de una magnitud mayor que mr/a se debe esperar que e(k) sea mayor que el valor dado por (8.6-34) y que se acerque al valor del electrón libre predicho por (8.6-15), en donde k 2 difiere de k~ en una cantidad que puede hacer que 'Yhn sea lo suficientemente pequeña de tal modo que el método que conduce a las ecuaciones (8.6-1'6) y (8.6-24) sea legítimo. De igual manera, para valores de k con una magnitud menor que mrfa, se puede esperar que e(k) sea menor que el valor dado por (8.6-34) y que nuevamente se acerque a soluciones antes obtenidas, cuando k 2 difería de k~ por una cantidad suficiente. Estas condiciones quedarán satisfechas si en (8.6-33) se escoge el signo más para k> mr/a y el signo menos para k< mrfa. La solución (8.6-15) o la segunda aproximación (8.6-24), que es mejor, en las regiones entre los bordes de banda, junto con la solución (8.6-33) para las regiones cercanas a los bordes de banda (los signos se seleccionan como se describió antes) conducen a una relación entre e y k como la que se ilustra en la figura 8.7. De acuerdo con esta figura, parece ser que las curvas de e en función de k son aproximadamente parabólicas cerca de los puntos de borde de la banda. La masa efectiva se puede establecer a partir de (8.4-8) mediante la derivación directa de (8.6-33). Estos cálculos son muy elaborados y es más fácil proceder haciendo que

nn k=-+k', a

(8.6-36)

7 El hecho de que la velocidad de grupo del electrón, en efecto es cero en estos puntos como es de esperarse para las ondas estacionarias que se asocian siempre con la reflexión de Bragg, se puede demostrar a partir de (8.6-33); los detalles de esta corroboración se les asignan como ejercicio al lector.

254

Teoría cuántica de los electrones en redes periódicas c(k)

.,.

-.,.

o Figura 8.7.

o

Representación esquemática de la relación € en función de k para la aproximación del electrón libre, tal y como se obtiene a partir de (8.6-24) y (8.6-33)

en donde k' es pequeña en comparación con rr/a, en (8.6-33). Thspués de efectuar algunas operaciones algebraicas, (8.6-36) se puede escribir en la forma

2

e( k)

1i = 2m

[(mt) 2+ k'2 + hl mAe ~(n1t)2( 1i 2 )2] \) + 4k'\-;; mAe -;;

1

(8.6-37)

en donde

Ae = 21V.I

(8.6-38)

representa la anchura de la región de energía prohibida en k= nrr/a. Para puntos cercanos al fondo de la banda superior, k' es muy pequeña y el radical de (8.6-37) se puede expandir mediante el teorema del binomio que da, aproximadamente,

e(k) = e.

1

2

2

2m

2

li k' ( +- Ae + - 1+

4e) A

n

'

(8.6-39)

Lle,

en donde En está dada por (8.6-35). Después de derivar dos veces y usar (8.4-8), es evidente que

li 2 li 2 m m* = d 2efdk 2 = d 2efdk' 2 = 1 + 4e. · Ae

(8.6-40)

Se puede demostrar de una manera similar que la masa efectiva para huecos crrcanos a la parte superior de la banda inferior, es la misma que el valor de los ele e trone~ dado por ( R.6-40).

La aproxifTIIlción del enlace firme

8.7

255

LA APROXIMACION DEL ENLACE FIRME

En la aproximación del electrón libre, la energía potencial del electrón se supuso pequeña en comparacwn con su energía total. Esto condujo a un planteamiento aproximado en el que se encontraron bandas de energía prohibidas y permitidas, y en donde la anchura de las bandas prohibidas era pequeña en comparación con la de las bandas permitidas en el límite en el que se satisfacía la suposición inicial. La aproximación del enlace firme parte de un punto de vista contrario, esto es, que la energía potencial del electrón representa casi toda la energía; en este caso, las bandas de energía permitidas son angostas en comparación con las bandas prohibidas. En el modelo del electrón libre se supone que los átomos del cristal están tan cerca unos de otros que las funciones de onda de los electrones de átomos circunvecinos se superponen en gran parte. Por tanto, existe una fuerte interacción entre los átomos cercanos, y los estados de energía permisibles del cristal resultante tienen muy poco parecido con las funciones de onda atómicas de los átomos individuales de los que se compone el cristal. Sin embargo, la aproximación de enlace firme se basa en la suposición de que los átomos del cristal están tan separados que la función de onda de los electrones asociados con átomos vecinos se superponen sólo en menor grado. La interacción entre átomos cercanos será relativamente débil en este caso, y las funciones de onda y los niveles de energía permisibles de todo el cristal estarán íntimamente relacionados con las funciones de onda y los niveles de energía de los átomos aislados. Por supuesto, la pregunta de cuál de las dos aproximaciones es correcta para una situación dada, depende del material particular de que se trate. En algunas substancias, la aproximación del electrón libre es muy apropiada, en tanto que en otras, la aproximación del enlace firme es mucho más correcta. Existen también cristales para los que ninguna de ellas es adecuada ya que se trata de una situación intermedia entre estos dos casos extremos. Las funciones de onda del cristal en la aproximación del enlace firme se basan en las funciones de onda de átomos aislados. Si la función de potencial relacionada con un átomo aislado es V0 (r), entonces la solución de la ecuación de Schródinger (8.7-1) representa las funciones de onda electrónicas del átomo. Supóngase que la función de onda de estado basal 1/1 0 no está degenerada y corresponde a una energía de estado basal e0 • Si un gran número de átomos de este tipo se combinan en una red periódica, de tal manera que el valor del potencial en las regiones que rodean a cada átomo individual en donde la función de onda de estado basal es grande, no se ve muy afectada por la presencia de los átomos vecinos, la función de onda del cristal (por lo menos para estos estados de enlace más firme) se puede escribir como una superposición lineal de funciones de onda atómicas de la forma

t/J(r) = L: ant/JoCr - r"),

(8.7-2)

n

en donde los vectores r y r n se relacionan tal y como se indica en la figura 8.8. La suma se toma sobre todos los átomos del cristal que, para mayor facilidad, se supondrá que tienen una extensión infinita. Puesto que todos los átomos del cristal son equivalentes, todos los coeficientes an deben tener el mismo valor absoluto; por tanto, deben poder expresarse en la forma aél>n, en donde a y cf>n son cantidades reales. Por la misma razón, la diferencia de fase cp entre cada par de átomos cerca-

256

Teoría cuántica de los electrones en redes periódicas





p

o Figura 8.8.



• •

• •











• •

Geometría vectorial usada en el cálculo de la sección 8.7.

nos a lo largo de cualquier eje cristalino dado, debe ser la misma (aunque no necesariamente es idéntica a lo largo de los tres ejes). Esto conduce a la selección del factor de fase tPn = k • rn en donde k es un vector constante. Por último, si las funciones 1/1 0 están normalizadas de tal modo que su integral tomada sobre todo el espacio es la unidad y, si se desea conservar esta normalización, se debe tomar a= l. En consecuencia, (8.7-2) se debe escribir en la forma 8 t/lk(r) =

L eik-r"t/1 0(r -

rn)·

(8.7-3)

n

Estas funciones de onda satisfacen la ecuación de Schrodinger para todo el cristal, con la función de potencial periódica de la figura 8.9, esto es, (8.7-4) El operador hamiltoniano total partes,

:Yf

se puede escribir como la suma de dos (8.7-5)

Potencial 1

r

Figura 8.9.

= rn

Funciones de potencial utilizadas en los cálculos de la sección 8.7.

8 Se puede demostrar que la ecuac10n (8.7-3) tiene la forma de una función de Bloch semejante a (8.2-14). Los detalles de esta comparación se asignan como ejercicio.

257

La aproximación del enlace firme

siendo (8.7-6) y

(8.7-7) De acuerdo con (8.7·1), es evidente que Jff ot/Jo do (8.7-3), J'f ot/lk

= e0 ¡J; 0 ,

por lo cual, utilizan-

= L eik '•Jff ot/lo(r- rn) =BoL eik '"t/lo(r- rn) = Bot/Jk· n

(8.7-8)

n

Ahora, de acuerdo con (4.14-5), la energía e se puede encontrar determinando el valor esperado del operador hamiltoniano, de donde, usando (8. 7-5) y (8.7-8),

f

t/I:(Jffo

ft/lt L

+ Jff')t/lk dv

•~. ffN,ao

~•,+. .

eikr"[V(r) -- V0 (J- rn)Jt/10(r- rn) dv

f.•N.d• (8.7-9)

A condición de que se haga caso omiso de la pequeña superposición de las funciones de ondas atómicas centradas en diferentes puntos de la red, las propiedades de normalización de las funciones t/Jo y la defmición (8.7-3) requieren que

i

t/Jkt/Jk dv sea igual a .V, es decir, el número de átomos dE'l cristal. Si se usa este hecho y se substituye el valor dado por (8.7-3) en lugar de t/Jk en el numerador de (8.7-9), se obtiene

e= 60

+ _!_ L \(L eik (r.-r,.) N

n

J

t/JÓ(r- rm)[V(r)- V0(r- rn)]t/1 0(r- rn) dv}. (8.7-10)

v

m

Se verá que, debido a la periodicidad del cristal y a causa de la suma sobre todos los valores de m, cada término de la suma sobre n da el mismo valor. El valor de la suma sobre 11, por tanto es el valor de cualquier término de la suma (por ejemplo, para mayor claridad, aquel para el que n = O) multiplicado por el número de términos de la suma, que es N En consecuencia, (8.7-10) se puede escribir como sigue

e( k)=

e + Le- ik '"' 0

m

I

t/ló(r- r"')[V(r)- V0(r)]t/1 0(r) dv,

(8.7-11)

v

en donde la suma se toma sobre todos los átomos del cristal. Sin embargo, puesto que la función de onda t/1 0 desciende casi siempre de un modo muy rápido con respecto a la distancia y, puesto que las magnitudes de las integrales de (8.7-ll) están gobernadas esencialmente por la cantidad de superposición entre dos funciones de onda centradas en átomos separados por distancias r m, las contribuciom.s de los términos de la suma se reducen con gran rapidez conforme aumenta rm. Por tanto, generalmente se tiene como buena aproximación al considerar sólo los ténninos del vecino más cercano. De acuerdo con esto, se hará caso omiso de todos los térn;inos

Teoría cuántica de los electrones en redes periódicas

258

que se relacionan con las contribuciones que van más allá de la del vecino más cercano en (8.7-11). También se supondrá que las funciones de onda 1/Jo son es[é· ricamente simétricas; en estas condiciones, todas las aportaciones del vecino más cercano serán idénticas. En consecuencia, este método se reduce al caso en el que la configuración electrónica de estado basal en el átomo aislado es la de un estado s como es, por ejemplo, para los metales alcalinos, aunque la extensión a los estados p es lo suficient~::mente directa y puede lograrse sin grandes problemas. 9 Para el caso m= O, la integral de (8.7-11) se convierte en

(8.7-12)

J.l/ló(r)[V(r)- V0 (r)]if¡ 0 (r) dv = -oc,

mientras que, para los átomos más cercanos, (8.7-13)

en donde rm es un vector que relaciona al átomo en el origen con el átomo vecino más cercano. Puesto que el cálculo real de las integrales de superposición es mu} complicado sólo se indicarán aquí los resultados en término de las cantidades que se definieron antes como -a: y - {3. En estas circunstancias, la ecuación (8.7-11) se puede escribir como sigue e(k) =

Bo

-oc-

f3 L e-ik •m,

(8.7-14)

m

en donde la suma sólo considera los átomos más cercanos. En ei caso de un cristal cúbico simple, las componentes del vector rm se pueden expresar como (8.7-15)

rm = (±a,O,O), (O,±a,O), (O,O,±a), en donde a es la constante de red. La ecuación (8.7-14) da, entonces, e(k)

= e0

-oc- 2{3(cos kxa + cos kya + cos kza).

(8.7-16)

De acuerdo con esta ecuación, es evidente que existe un rango de valores de energía permisibles correspondientes a varios valores que pueden tener kx, k y y kz. Los estados permisibles forman una banda de energía más o menos en la misma fom1a en que sucede con las que se vieron en relación con la aproximación del electrón libre. De acuerdo con (8.7-16), el valor mínimo de la energía está en kx =kv= kz =O en ese punto, es decir, en el origen de una gráfica con coordenadas ortogo· nales (kx, k y, kz) en el espacio k. Los valores máximos se producen en los vértices ± ~. ± ~). en don· a a a de todas las permutaciones de los signos 1- y -- entre las tres coordenadas se toman

de un cubo dentro del espacio k cuyas coordenadas son ( ±

9 llon~.

Véa~e,

por ejemplo, N 1·

~.

Mnlt y 11. Jones, Theory o[ Metals and Alloys, Dover Publica-

Nuev.1 York (1958), página 70.

La aproximación del enlace firme

259

para generar ocho puntos de los vértices. En estos sitios cada término de coseno toma el valor - l. La diferencia de energía entre los puntos de energía máxima y mínima es, de acuerdo con (8.7-16), 12 (3. Esta es la anchura de la banda de energía correspondiente al estado s del átomo aislado. Si los átomos vecinos más cercanos están muy separados, la superposición de las funciones de onda 1/; 0 (r) y 1/; 0 (r- rm), como lo expresa el producto 1/; 0 (r)V; 0 (r- rm) en la integral (8.7-13), se hace muy pequeño como sucede con el valor de {j según lo establece dicha ecuación. En el límite donde las distancias atómicas se hacen grandes (y es en este límite en donde son realmente adecuadas las aproximaciones en las que se basan los cálculos de enlace firme), las bandas de energía permisible se hacen angostas acercándose a un solo valor de energía discreta, correspondiendo al nivel energético del estado atómico s conforme la separación se hace infinita. Esta variación de la anchura de banda con el espaciamiento atómico se ilustra esquemáticamente en la figura 8.1 O

Niveles atómicos

Bandas permitidas

Distancia

ES::>---------+- interatómica o " • Espaciamiento de equilibrio Figura 8.10.

o:

00

Representación esquemática de la divhión de los niveles discretos de energía atómica en bandas, conforme los átomos aislados se combinan en una red cristalina.

Para un electrón que se mueve en la dirección x, ky = kz =O. Si la cantidad de movimiento es lo suficientemente pequeña de tal manera que kx ~ rrfa, el electrón estará cerca de la base de la banda de energía. En estas condiciones, al aproximar el cos kxa en (8.7-16) mediante los dos primeros términos de su expansión de serie, (8.7-16) se convierte en (8.7-17)

Esto muestra que la relación E en función de kx es parabólica y que, por tanto, el electrón se comporta básicamente como si fuera libre. Como siempre, la cantidad llkx se puede interpretar como la componente x de un vector de cantidad de movimiento del cristal p = llk. La masa efectiva está dada por (8.7-18)

260

Teoría cUIÍntica de los electrones en redes periódica

De acuerdo con la simetría de la ecuación (8.7-16), es obvio que la masa efectiva asociada con el movimiento en las direcciones y y para todas las cantidades pequeñas de movimiento, será la misma que la que se dio en (8.7-18) y, por tanto, la masa efectiva es isotrópica o independiente de la dirección. No obstante, no siempre sucede así, sobre todo en cristales no cúbicos; la masa efectiva en este caso es anisotrópica con frecuencia, y debe considerarse como un tensor. Este punto se verá más detalladamente en la siguiente sección. De acuerdo con (8.7-18), parece que conforme aumenta la distancia reticular a, disminuye la masa efectiva; sin embargo, lo que sucede es exactamente lo contrario, ya que conforme aumenta a, la integral de superposición {3 disminuye con mucha mayor rapidez, de tal manera que el producto {3a 2 disminuye rápidamente al incrementarse las distancias reticulares. Por tanto, de acuerdo con (8.7-18), en el límite extremo del enlace firme, un electrón se hace muy "pesado", lo c~al constituye una expresión del hecho de que, en estas circunstancias, no se transfiere fácilmente de un átomo a otro.

8.8

DINAMICA DEL ELECTRON EN ESTRUCTURAS BIDIMENSIONALES Y TRIDIMENSIONALES; SUPERFICIES DE ENERGIA CONSTANTE Y ZONAS DE BRILLOUIN

En esta sección se verá minuciosamente el comportamiento de los electrones en redes periódicas bidimensionales y tridimensionales, utilizando siempre que se p_ue_da el ejemplo del cálculo de la aproximación de enlace firme para la estructura cubica simple, como ilustración de los principios generales en cuestión. Es evidente. que las ecuaciones dinámicas de la sección 8.4 se pueden ex tender de un modo duecto a una situación bidimensional, en cuyo caso se obtiene (8.8-1) para la velocidad del electrón, en donde Vk se refiere al operador gradiente en el espacio ortogonal k cuyas coordenadas son (kx, ky, kz). Por tanto, se puede escribir (8.8-2) Si A es un vector cuyas componentes son las funciones de kx, ky y kz, cada componente A~ (o:= x, y, z) debe satisfacer la relación

dA~= oA. dkx dt

okx dt

+ iJAa '!_~ + iJA, dkz oky dt

okz dt

=(V kA). dk. ~ dt

(8.8-3)

El vector dA/dt, entonces puede expresarse, como el producto escalar del tensor10 Vk A y el vector dk/dt, de donde, dA dk - - = (VkA) • -dt dt ' lO t·:n l'l ¡1péndice B ~r incluye una hreve de~cripción del análisis p.1ra l'ntrnder lo~ conccptm expucstm en este hhro.

(8.8-4)

ten~orial

que se requiere

Dinámica del electrón, superficies de P-nergía y zonas de Brillouin

261

cada componente del producto tensorial anterior conduce a una ecuación de la forma (8.8-3). Al aplicar esta fórmula a (8.8-3), si se hace que k= p/h, se obtiene

(8.8-5) Esta ecuación es básicamente la ecuación de fuerza de Newton dvg/dt = F/m*. Sin embargo, es obvio que la recíproca de la masa efectiva es un tensor de la forma

(8.8-6)

Los elementos de este tensor son, claramente,

oe 2

li 2

(8.8-7)

okaokp'

lo cual demuestra que el tensor de masa efectiva recíproca es simétrico, es decir, que (1/m*)pa

= (1/m*)afJ•

(8.8-8)

En general, se debe considerar que la masa efectiva es un tensor debido a que la curvatura de la relación e(k) no es necesariamente la misma a lo largo de todas las direcciones posibles dentro del espacio k; en consecuencia, es posible que se tenga una masa efectiva diferente para cada dirección posible. Para el cristal cúbico s1mple de la sección 8. 7, para valon:s ka ~ 1, la ecuación (8.7-16) se puede escribir en la forma

(8.8-9) Esto permite ver que todos los elementos que están fuera de la diagonal del tensor de masa efectiva (8.8-7) son cero, y que cada uno de los elementos sobre la diagonal es igual a h2 /2{3t:z2, por lo cual el tensor se reduce a h2 /2{3a 2 por el tensor unitario [Da¡¡]. La masa efectiva es claramente isotrópica en estas circunstancias y puede representarse como la cantidad escalar h2 /2{32, lo cual concuerda con las conclusiones de la sección anterior. A continuación se investigará la forma de las superficies de energía constante en el espacio k, para la estructura cúbica simple que se vio en la aproximación de enlace firme en la sección anterior. La e~uación de estas superficies sencillamente es (8.7-16) en donde e(k) se considera como una constante paramétrica. En relación con (8.7-16) se mencionó que el valor mínimo de e se obtenía en el punto kx = ky = kz = O, en donde todos los términos de coseno alcanzan el valor de la unidad. Para valores de e ligeramente mayores que este mínimo, los cosenos deben estar cerca de la unidad y, por tanto, los argumentos kxa, kya y kza deben ser todos muy pequeños. En este caso, (8.7-16) se reduce a la forma antes indicada como (8.8-9), que se puede reacomodar ligeramente para dar

2

kx

2

+ k,

e(k) 2 +k. = f3a 2

e0 -

-

oc {3a 2

6/3

= consl.

(8J~-10)

262

Teoría cutintica de los electrones en redes periódicas

Evidentemente, esta es la ecuación de una esfera dentro del espacio k. La forma esférica de todas las superficies de energía constante revela que los electrones de esta región del espacio k se comportan como electrones libres; se observará en (5.2-18) que, para partículas libres, es esférica la superficie de energía constante en el espacio de la cantidad de movimiento. Conforme aumenta el valor de e, el radio de la superficie esférica de energía constante también aumenta hasta que los valores de k asociados con los puntos sobre la superficie se hacen tan grandes que la aproximación ka < 1 ya no sigue siendo válida. En este caso, se debe usar la ecuación más general (8.7-16) para graficar las superficies de energía constante y, conforme aumenta e, las superficies que se obtienen son como se ilustra en la figura 8.11(a-f). Al incrementarse e, la esfera se expande, se distorsiona un poco, como sucede en (b) y en e= e 1 + 413 (en donde e 1 es el valor de e en el punto mínimo o e0 -a- 613) adquiere una furma casi octohédrica como la que se presenta en (e). En este punto, la superficie de energía toca el cubo limitante, cuyo lado es 2rr/a, sobre el cual se hablará más tarde. Conforme e aumenta más todavía, la superficie adquiere la forma que se ilustra en (d), y cuando e= e 1 + 813 adquiere la forma que aparece en (e). En este punto la superficie se divide en ocho hojas. cada una de las cuales se acerca al vértice del cubo conforme e tiende a su valor máximo para la banda e1 + 12/3. Estas ocho ramas tienen una forma aproximada de octantes de una esfera en el límite en que e se acerca a su valor máximo. La superficie de energía constante tiene siempre una simetría cúbica en este ejemplo. Las intersecciones de la superficie de energía constante con el plano kxky se ilustran en la figura 8.12. Se puede considerar también que estas curvas son las de energía constante correspondientes a un cristal bidimensional con una red cuadrada cuyo espaciamiento interatómico es a. De acuerdo con (8.7-16), es evidente que todos los estados dentro de la banda deben tener una energía entre e 1 y e 1 + 12/3, y que todos los estados posibles dentro de este rango de energía están representados por los valores de (kx, ky, kz) que quedan dentro de los límites

(

1t 1t ± -, ± -, ± 1t) - .

a

a

a

Si se tiene un número dado de electrones que pertenecen a esta banda de energía y si la temperatura está en el cero absoluto, los estados electrónicos de energía estarán todos ocupados hasta una energía de Fermi dada, de acuerdo con el principio de exclusión de Pauli. Por tanto, la distribución de electrones quedará dentro de un volumen en el espacio k que está limitado por una superficie de energía constante y en donde el valor de la energía sobre la superficie es la energía de Fermi e1. Con frecuencia, esta superficie se denomina superficie de Fermi. De acuerdo con la exposición de la sección 5.5, se vio que la superficie de Fermi para electrones libres es una esfera. Para electrones que están dentro de un potencial periódico de un cristal, la superficie de Fermi puede ser también aproximadamente esférica si la banda está casi vacía o casi llena; este hecho se ilustra claramente en la figura 8.11(a) y (f) para el ejemplo que acaba de verse en detalle. A temperaturas que sobrepasan al cero absoluto, algunos de los electrones se excitarán a estados de energía superiores a e1 , quedando fuera de la superficie de Fermi, y se tendrán algunos estados desocupados dentro de esta superficie. En consecuencia, la transición entre los estados llenos y vacíos ya no será muy marcada. No obstante, si la temperatura es pequeña en comparación con la de Fermi, la región de transición será muy delgada y la validez esencial del cuadro de la superficie de Fermi no se verá afectada. A continuación se examinará lo que sucede en les puntos de la superficie del cubo limitante que encierra al volumen del espacio k, que pueden ocupar los estados electrónicos pertenecientes a esta banda. Para mayor simplicidad, primero se limitará la atención solamente al plano kxky; las soluciones de este plano se relacionan con

Dinámica del electrón, superficies de energía y zona de Brillouin

(o)

(ko«l)

(e) (•

(b) (•«1+4/3)

=• 1+4/3)

(e) (• =•1+8/3)

Figura 8.11.

263

(f) (•1+8/3« «1+12t:l)

Configuraciones sucesiva; de la superficie de Fermi para un cristal cúbico simple con funciones de onda e'féricamente simétrica' en la aproximación en donde sólo se toman en cuenta las interacciones del vcl in o má~ cercano. Al aumentar la población electrónica en la banda, elevando con ello, el nivel de Fermi desde la base de la banda ha~ta la parte superior de la misma, la superficie de Fermi pasa de la forma casi esférica que aparece en (a), atravesando las formas intermedias compleja~ (b)-(e), hasta llegar a la configuración cubo menos esfera en la zona de Brillouin ca'i llena ilustrada en (f).

una red cristalina cuadrada bidimensional. Sea un punto en el borde superior (o inferior) de la región cuadrada que se ilustra en la figura 8.12; la coordenada ky de este punto es rrfa, en tanto que la coordenada kx puede tener cualquier valor arbitrario, por ejemplo, kxo· Entonces, la longitud de onda A. del electrón estará dada por

(8.8-11)

264

Teoría cuántica de los electrones en redes periódicas

en tanto que el seno del ángulo incidente cristalinos paralelos al eje x, es sen

e=

ky

Jk~ +k;

e relacionado

con un conjunto de planos

=

.

nfa Jk2 .xO

(8.8-12)

n2

+ a2

De acuerdo con esto, es obvio que la condición de Bragg (2.1-1) con n = 1, se satisface mediante la función de onda electrónica en todos los puntos en esta parte de la frontera. Del mismo modo, es fácil verificar que la condición de Bragg (relacionada ahora con un ángulo incidente que se indica como un conjunto equivalente de planos paralelos al eje y), se satisface en todos los puntos del borde derecho (o izquierdo) del cuadrado limit.mte. El electrón, considerado como una onda, se difracta internamente mediante la red, siempre que su vector de cantidad de movimiento toque esta frontera cuadrada. Los puntos del espacio k que quedan más allá de los límites de estas fronteras corresponden a los puntos que están fuera de la banda de energía más baja, perteneciendo a otras bandas que se originan en estados atómicos de energía más alta que el estado basal. Los límites de las regiones del espacio k ocupadas por las bandas más altas, se determinan mediante la orientación de las fronteras a lo largo de las cuales se pueden producir reflexiones de Bragg (n > 1) de orden más alto. Siempre existe un vacío de energía entre las bandas, como se ilustra en la figura 8.10; por ejemplo, siempre que se cruza el borde de la región cuadrada encerrada por las líneas kx = ± rr/a, ky = ± rr/a, debe ocurrir una discontinuidad de energía acompañada de una reflexión interna de Bragg. El interior de la región contiene la totalidad de estados pertenecientes a la banda de energía más baja. Se observará que el vector k tiene las mismas dimensiones que la red recíproca. En la sección 2.6 se demostró que la condición de reflexión de Bragg puede escribirse como (8.8-13) en donde k es el vector de propagación y en donde G/2rr es un vector que va desde el origen hasta cualquier punto de la red recíproca. Para una red cuadrada bidimensional de puntos cuyo espaciamiento reticular es a, la red recíproca es una red cuadrada con un espaciamiento reticular 1/a. Si para mayor facilidad se considera que el origen está en un punto de red, los vectores G tienen la forma G,..

2n



= -(¡,u"

a

+ viy. )

(8.8-14)

en donde ¡.¡. y v son enteros y en donde ix e iy son vectores unitarios en las direcciones kx y k y, respectivamente. Si se usa esta forma para el vector G, (8.8-13) se convierte en

¡.¡.k"

+ vk, = --1t (¡.¡. 2 + v2 ). a

(8.8-15)

Esta ecuación representa una familia de líneas rectas en el plano kxky. Sus intersecciones kx y ky son .. np.z+v2 k" mtcrseccwnes: - -- - - a fJ. (8.8-16) ky intersecciones:

a

v

Diruímica del electrón, superficies de energía y zona de Brillouin

265

Cada una de estas líneas representa una frontera a lo largo de la cual se produce una reflexión de Bragg y que puede formar la frontera entre estados pertenecientes a diferentes bandas de energía. Si se toma 11 = O, v = ± 1, y 11 = ± 1, v = O en (8.8-15), se obtienen las cuatro líneas kx = ± rr/a y ky = ± rr/a que encierran la región ilustrada en la figura 8.12, cuyo interior contiene todos los estados de la

Figura 8.12.

Contornos de energía constante dentro de la zona de Brillouin, para una red cuadrada bidimensional, usando sólo funciones de onda esféricamente simétricas y las interacciones del vecino más cercano. Se forma el mismo patrón mediante los trazos de la superficies de Fermi de la figura 8.11 para la red tridimensional sobre el plano kxky.

banda de energía más baja del cristal. Esta reg10n del espacio k se denomina la primera zona de Brillouin (esta terminología ya se introdujo en relación con los cálculos unidimensionales que se vieron en la sección 3.3). Si ahora se considera J1 = ± 1, v = ± 1, se obtienen las cuatro líneas kx ±ky = 2rr/a y kx ± ky = - 2rrfa. Estas cuatro líneas aparecen grafícadas en la figura 8.13(a). En estas fronteras, la condición de Bragg (2.1-1) se satisface con el orden de reflexión n, que es igual a 2. Esto se puede demostrar a través de los mismos métodos que se emplearon antes en conexión con las fronteras de la primera zona de Brillouin. La región encerrada entre la primera zona de Brillouin y estas cuatro líneas intersectoras contiene todos los estados correspondientes a la segunda banda de energía (que se relacionaría con el segundo nivel atómico de energía más baja si la aproximación del enlace firme fuera válida). Esta se conoce como la segunda zona de Brillouin, que tiene la misma área que la primera y, en efecto, las cuatro secciones independientes de esta zona se pueden trasladar al interior de la primera moviendo las secciones paralelas a los ejes en distancias que sean enteros múltiples de 2rr/a. Por tanto, las cuatro secciones encajan como piezas de un rompecabezas para formar una región cuadrada que es una réplica exacta de la primera zona, como lo ilustran las líneas punteadas de la figura 8.13{a). La última representación de la segunda zona es, sencillamente, la

266

Teoria cuántica de los electrones en redes periódicas

Ir,

c:_--:_1 Pnmera zona [~'

Segunda zona

r::-l Tercera zona _j

~] Cuarta zona Quinta zona



o

(e)

Figura 8.13.

Construcción de las zonas de Brillouin para una red cuadrada bidimensional (a) Primera y segunda zona~, (b) construcción de la tercera zona, (e) las primeras cinco zonas.

representación de zona reducida de la secc1on 8.5. La justificación de una transformación de este tipo con referencia al modelo de Kronig-Penney ya se vio en esa misma sección. Expresado con más precisión, si (8.8-17) es una función de onda del sistema que satisface las ecuaciones de Schrodinger y todas las condiciones de frontera pertinentes, y si se define

. ('2n_,;rr) k , -_k_ lx a

-

. (2nyn)

ly - -

a

-

. (211zí'C)

lz - - '

a

(8.8-18)

Dinámica del electrón, superficies de energía y zona de Brillouin

267

en donde ix, iy e iz son vectores unitarios a lo largo de las direcciones kx, k y, kz y en donde nx, ny, nz son enteros, la misma función de onda se puede expresar como

= eik' •v(r),

(8.8-19)

en donde v(r) es nuevamente una función periódica que tiene la periodicidad de la red. De donde la función de onda se puede escribir en la forma de Bloch en términos de k o el vector de onda transformado k'. Se debe observar que (8.8-18) se puede escribir también como

k'= k- G

(8.8-20)

en donde G/2n es un vector que conecta dos puntos reticulares de la red recíproca.11 La transformación (8.8-18) o (8.8-20) puede usarse siempre para llegar a una representación de zona reducida en la que la zona transformada ocupa la misma región del espacio k que la primera zona. La situación es muy similar a la que se encontró en la sección 3.3 en el caso de las vibraciones mecánicas de una cadena lineal de masas discretas puntuales y que se vio en relación con la figura 3.8. Las zonas más altas se pueden construir mediante una ampliación del procedimiento usado para llegar a la forma de la primera y segunda zonas. En (8.8-15), si se toma 11 = O, v = ± 2 ó 11 = ± 2, v = O, se obtienen las cuatro líneas kx = ± 2n/a, ky = ± 2n/a, como se indica en la figura 8.13(b). También en este caso es evidente que la reflexión de Bragg se desarrolla a lo largo de estas líneas y la primera reacción es asignar todos los espacios que quedan fuera de la segunda zona y dentro del área encerrada por estas cuatro líneas, a la tercera zona de Brillouin. Sin embargo, esto no es correcto, ya que esta área es mucho mayor que la de la primera y segunda zonas, y cada zona de Brillouin debe encerrar la misma superficie dentro del espacio k. En realidad, existen líneas de reflexión adicionales de Bragg que pasan por esta superficie y forman fronteras que dividen este espacio en las zonas tercera, cuarta, quinta y sexta. El criterio que se sigue para saber de qué zona se trata es el siguiente: al desplazarse a lo largo de una línea radial general que no atraviesa ninguna intersección de las líneas de reflexión de Bragg, principiando desde el origen, se debe pasar por la primera, la segunda, la tercera, la cuarta, • • • etc., zonas sucesivamente, y cada línea de reflexión de Bragg que se cruce forma la frontera a lo largo de la trayectoria radial entre una zona y la siguiente zona vecina más alta. En consecuencia, al seguir adelante desde el origen por la línea OA, se penetra en la tercera zona en C y se sale de ella en D, con la siguiente línea de reflexión de Bragg que intersecta a OA, más allá de D, se penetra en la cuarta zona. No obstante, si se desplaza a lo largo de la línea OB, se entra a la tercera zona en E y se sale de ella en F, que se queda· sobre la línea kx = n/a que es ahora la tercera línea de reflexión de Bragg desde el origen, a lo largo de la trayectoria OB. Más allá de F, por la línea OB queda una parte de la cuarta zona. De donde, la tercera zona se compone de los ocho triángulos que se ilustran en la figura 8.13(b). Nuevamente es obvio que estos ocho triángulos se pueden ensamblar de tal modo que formen un cuadrado dentro de la primera zona, si se someten a una traslación apropiada de acuerdo con (8.8-18). Las fronteras de la cuarta zona se forman, en parte, por las

11 En efecto, la expresión (8.8-20) es en realidad la definición fundamental de esta transformación, mientras que (8.8-18) se refiere específicamente a una transformación de esta naturaleza en el caso particular de la red cúbica simple.

268

Teoría cuántica de los electrones en redes periódicas

líneas para las que J.1 = ± 1, v = ± 2, y J.1 = ± 2, v = ± 1 (en donde se toman todas las permutaciones posibles de los signos más y menos). Se obtiene una familia de ocho líneas (tales como kx ± 2kx =- Srr/a), que conduce a las fronteras de las zonas cuarta y quinta, como se indica en la figura 8.13(c), por los procedimientos antes descritos. Evidentemente, este método de cálculo se puede extender ad infinitum para encontrar tantas zonas como se desee. Al construir las fronteras de las zonas de Brillouin, de este modo, generalmente conviene principiar con vectores G cuyas magnitudes (según se obtienen a partir de [8.8-14] o su equivalente en otra estructura cristalina) son tan pequeñas como sea posible, y luego procediendo al siguiente

(a)

(d) (e)

Figura 8.14.

Configuración de la primera zona de Brillouin para (a) una red cúbica simple, (b) una red cúbica centrada en el cuerpo, (e) una red cúbica centrada en la cara y (d) una red hexagonal.

conjunto de vectores G más cortos, Juego a los siguientes más reducidos y así sucesivamente. Puesto que la condición de reflexión de Bragg implica la formación de ondas estacionarias a una incidencia normal, la velocidad de grupo y, por ende, el gradiente de e normal a la frontera de cualquier zona de Brillouin, debe desaparecer, es decir,

(-aro) ak

1

.l

a

= n · Vkw =- n · Vke =O la frontera li

(8.8-21)

en la zona de frontera, si n es un vector unitario normal a la frontera. Se puede verificar esta conclusión general a partir de los resultados del modelo de potencial de

Aisladores, semiconductores y metales

269

Kronig-Penney, la aproximación del electrón libre y la aproximación del enlace firme. Estos detalles quedan como ejercicio para el lector. La extensión de estos resultados para incluir redes tridimensionales es totalmente directa. Por supuesto, en este caso las zonas de Brillouin son regiones tridimensionales del espacio k encerradas por planos a lo largo de los cuales se satisface la condición de Bragg. Las ecuaciones de estas fronteras de plano se obtienen de la ecuación (8.8-13) al igual que sucedió en el caso bidimensional. Nuevamente cada zona tiene un volumen equivalente y las partes separadas de las zonas más altas se pueden juntar para formar una réplica de la primera zona, aplicando la transformación apropiada de (8.8-20). Es evidente que la primera zona de Brillouin para una red cúbica simple es un cubo cuyo lado es 2Tr/a. La forma de la primera zona de Brillouin para las redes cúbicas centrada en la cara y centrada en el cuerpo, así como para la estructura hexagonal, se ilustran en la figura 8.14. La zona para la red cúbica centrada en el cuerpo es un dodecaedro rómbico en el que todas las caras son planos { 11 O} dentro del espacio k. La zona para la red cúbica centrada en la cara es un tetradecaedro, un poliedro de 14 caras, que tienen una orientación {110} y { 111}. La superficie de Fermi debe tener, en todos los casos, las propiedades de simetría de la zona de Brillouin correspondiente que, a su vez, se relacionan con las propiedades de simetría de la red cristalina.

8.9

AISLADORES, SEMICONDUCTORES Y METALES

En la seccwn 8.5 se demostró que no se puede obtener una corriente eléctrica en bandas vacías o bandas totalmente llenas. Por tanto, cualquier conductividad eléctrica que presente un cristal debido al movimiento de electrones libres, se debe al movimiento de electrones dentro de las bandas de energía que están sólo parcialmente llenas. Esta observación constituye la base de la diferencia entre los aisladores, los conductores metálicos y los semiconductores. En un aislador, el número de electrones dentro del cristal es apenas el suficiente para llenar completamente cierto número de bandas de energía. Sobre estas bandas de energía existe una serie de bandas totalmente llenas; pero entre las bandas llenas y vacías se encuentra una región de energía prohibida tan ancha que es prácticamente imposible, a temperaturas físicamente posibles, excitar térmicamente un número importante de electrones para que atraviesen esta región desde la parte superior de la banda llena más alta a la base de la banda vacía más baja. Entonces, todas las bandas están ya sea llenas o vacías y no puede fluir una corriente de electrones libres. Esta situación se ilustra en la figura 8.15(a). Si es muy pequeño el vacío de energía .1€ entre las bandas llenas y vacías en este tipo de cristal, y, por tanto, se tiene una probabilidad estadística apreciable de que los electrones puedan excitarse térmicamente de estados cercanos a la parte superior de la banda llena, para atravesar el vacío, hasta los estados cercanos a la base de la banda vacía. Se dispondrá de un número limitado de electrones libres para conducción de corrientes eléctricas en la banda superior casi vacía y, además, los estados electrónicos vacíos que quedan cerca de la parte superior de la banda más baja permiten que esta banda contribuya al flujo de corriente eléctrica a través del mecanismo de conducción por huecos. Un material de esta naturaleza se conoce como semiconductor; su conductividad eléctrica es casi siempre mucho menor que la de un metal debido a la concentración limitada de electrones libres y huecos y, además, depende enormemente de la temperatura, que aumenta con gran rapidez al incrementarse ésta, ya que la probabilidad de la excitación térmica se incrementa con la

270

Teoría cuántica de los electrones en redes periódicas

temperatura. Por supuesto, la conductividad eléctrica de un semiconductor es también una función del vacío de energía ..::le- La diferencia entre los aisladores y los semiconductores es sólo de grado; todos los semiconductores pueden hacerse aisladores ideales conforme la temperatura se acerca al cero absoluto, debido a que entonces la probabilidad asociada con la excitación térmica se hace tan pequeña que tiende a desaparecer. Del mismo modo, a temperaturas lo suficientemente elevadas (que con frecuencia son imposibles de alcanzar en la práctica debido a que el cristal se funde o se evapora), todos los aisladores presentan propiedades semiconductoras. La estructura de las bandas de un semiconductor aparece ilustrada en la figura 8.15(b). Si el número de electrones de un cristal no base.! para llenar por completo la banda de energía más elevada, sino que la deja sólo llena en parte, muchos de ellos pueden comportarse como electrones libres y servir como carga o portadores de carga. En la figura 8.15(e) se ilustra esta situación. Un cristal de esta índole presentará todas las propiedades características de un conductor metálico, por ejemplo, alta conductividad eléctrica y térmica y una gran reflectividad óptica.

Distribución de Fermi-Dirac

Banda "casi vacía"

Banda "vacía"

---~-Banda superior superpuesta

Electrones térmicamente excitados

6•

E

l-

\-~------ ;_;= l Ban:~;~ ~:~~~:l=:_:nte llena ~~T ~~ ~j~&~~~ d 1 • ~~ :wd~-

sta os e ectronico~ vacíos ~~y~~9~L );;:;:

Banda inferior;; casi llena /;

W(///~% W'ff~ w~lena/;/~ 2LL/.'///h

?/íllenaW 0gUenaW

o (o)

Figura 8.15.

Aislador

(bl

Semiconductor

(el Metal (Banda parcialmente llena)

Metal (Banda superpuesta)

(d)

Diagrama de las bandas de energía de (a) un aislador, (b) un semiconductor, (e) un conductor metálico (banda parcialmente llena) y (d) un conductor metálico (bandas superpuestas).

La determinación del número de estados electrónicos disponibles en una banda de energía dada de una substancia particular, no es un procedimiento del todo directo y, en general, implica el uso de técnicas de cálculo de la mecánica cuán tic a que están fuera del alcance de esta obra. Si se supusiera que siempre es válida la aproximación del enlace firme, las bandas de energía siempre se originarían de los niveles de energía de los átomos aislados, las funciones de onda de una banda dada se compondrían siempre de una combinación lineal de las funciones de onda del estado electrónico de energía correspondiente de los átomos aislados y el factor de degeneración, asociado con un nivel de energía dado en la banda de energía, sería el mismo que el del nivel correspondiente del átomo libre. De acuerdo con esto, se

Aisladores, semiconductores y metales

271

tendría una banda ls ccrrespondiente al nivel ls, una banda 2s, una banda 2p, una banda 3s, una banda 3p, una banda 3d y así sucesivamente. De acuerdo con la ecuación (8.2-20), el número de niveles de cada banda sería N y, puesto que la degeneración de cada nivel es el mismo que el del nivel atómico correspondiente, el aúmero de estados cuánticos electrónicos (incluyendo la degeneración de espín) de cada banda sería el que se indica en la tabla 8.1.

TABLA 8.1. Banda

No. de estados

Is

3p

2N 2N 6N 2N 6N

3d

ION

2s 2p 3s

Por ejemplo, ahora se verá un metal alcalino como el sodio. El sodio tiene dos electrones Is, dos electrones 2s, seis electrones 2p y un solo electrón 3s. En un cristal de N átomos se tienen, entonces, 2N electrones ls, 2N electrones 2s, 6N electrones 2p y N electrones 3s. Si se comparan estas cifras con las que se dan en la tabla 8.1, se llega a la conclusión de que las bandas ls, 2s y 2p, están totalmente llenas; pero que la banda 3s, que contiene 2N estados, sólo está llena a la mitad. Por tanto, se puede esperar que el sodio -junto con todos los demás metales alcalinos- sea un conductor metálico, como en efecto lo es. Por otro lado, si se acepta estríctamente este método, debe esperarse que el magnesio, cuya estructura atómica es Is 2 )2s 2 2p 6 )3s 2 , sea un aislador o semiconductor, ya que ahora la banda 3s está llena. El hecho de que el magnesio (y otros elementos alcalinotérreos) sean metales, se debe al hecho de que la energía de las bandas 3s y 3p se superpone y algunos de los electrones "se derraman" de la banda 3s a la 3p, dejando a la primera no del todo llena y haciendo que está última esté parcialmente ocupada, como se ilustra en la figura 8 lS(d). En realidad, las funciones de onda 3s y 3p de estas bandas se entremezclan intensamente, de modo que ni siquiera es del todo correcto referirse a las bandas en esta forma. A decir verdad, el método sencillo del enlace firme ya no es una buena aproximación que permita describir el comportamiento de los electrones s y p en la capa exterior de valencia de la mayoría de las substancias metálicas; esta mezcla de las bandas s y p para los electrones de valencia es más bien la regla que la excepción. Por ejemplo, en el caso del silicio, los estados 3s y 3p se combinan en dos bandas que no se superponen, en donde cada una de ellas contiene 4N estados, de tal manera que los electrones de valencia 4N ocupan por completo la banda inferior para fonnar la configuración de banda de un semiconductor como la de la figura 8.15(b). La superposición de bandas se produce a pesar de que existe un vacío de energía en todos los puntos en la frontera de la zona de Brillouin que separa las dos bandas. Usando la zona cuadrada de la figura 8.12 como ejemplo, se puede ver claramente cómo se presenta esta situación. La superficie de Fermi en esta figura toca primero la frontera de zona a lo largo de los ejes kx y ky a una energía E= e 1 + 4(3; pero la zona de Brillouin y la banda de energía correspondiente no ~stán completamente llenas hasta que e -- <: 1 + 8(3. Puede suceder que el vacío de energía entre esta banda y la siguiente, en la dirección de los ejes kx y k y, sea

272

Teoría cuántica de los electrones en redes periódicas

menor que 4(3, que es la energía adicional requerida para llenar por completo la banda inferior. Si esto sucede, los electrones se derramarán hacia la banda superior en las direcciones kx y ky antes de que se llenen por completo los vértices de la zona original, dando como resultado la situación de superposición de bandas que se mencionó anteriormente. Esta situación se ilustra en la figura 8.16. Debe recalcarse

~(k)

Esquinas no llenas Electrones que de la banda inferior llenan parcialmente (conducción por huecos) la sigUI en te zona superior Los electrones "se derraman" sobre la siguiente banda (conducción por electrones) Esquinas de la zona no llena

.,.

(a)

a - - ~(k)

Relación a lo largo de la trayectoria OA a lo largo de la trayectoria OB

- - - <(k) Relación

(b)

Figura 8.16.

(a) Un caso en el que los estados de energía más bajos dentro de la banda más alta (en los centros de los lados de la zona cuadrada, sobre los ejes kx y kY.) tienen una energía más baja que los estados de energía más alta de la banda más baja (en las esquinas de la zona). En estas circunstancias, los electrones comienzan a ocupar la banda más alta antes que la más baja esté completamente llena. (b) Representación esquemática de la relación de f en función de k en la dirección OA (las curvas continuas) y OB (curvas punteadas) que ilu~tra de un modo ligera· mente distinto la situación descrita en (a)

que cuando se presenta esta circunstancia, la supostcton simple del enlace firme de las funciones atómicas de onda asociadas con un solo nivel ya no es válida y que las bandas de energía se deben volver a calcular, suponiendo una mezcla de funciones de onda relacionadas con ambas bandas. También debe hacerse notar que en esta situación, tanto la conducción electrónica efectuada por los electrones que se derraman hacia la banda superior, como la conducción de huecos realizada por los estados vacíos en la parte superior de la banda más baja, se producen de un modo simultáneo. La superficie de Fermi entonces tiene dos ramas separadas, una para electrones en la zona externa y otra para huecos en la zona original. Si la masa efectiva del hueco es menor que la del electrón, esta situación conduce a un coeficiente positivo de Hali.l 2 Así se puede comprender una de las discrepancias más inquietantes de la teoría original del electrón libre de los metales.

12

En un capítulo posterior se verá la forma en que esto sucede.

Densidad de la función de estados y Cllmbios de fase

273

Se observa que la teoría cuántica permite entender en términos generales, por qué las propiedades eléctricas de los conductores metálicos y los aisladores son tan marcadamente distintos, aun a pesar de que con frecuencia se requiere un cálculo de mecánica ondulatoria muy elaborado para establecer con exactitud las superficies de énergía y las funciones de onda relacionadas con las bandas electrónicas de valencia en una substancia en particular.

8.10

DENSIDAD DE LA FUNCION DE ESTADOS Y CAMBIOS DE FASE EN ALEACIONES BINARIAS

En el capítulo 5 se derivó la función de densidad de estados para partículas libres en la forma de la ecuación (5.2-22). Intuitivamente, parece obvio que la función de densidad de estados para los electrones dentro de los cristales debe ser la misma que la que se obtuvo antes, excepto quizá que se debe incluir la masa efectiva en lugar de la masa inercial. En breve se verá que esto es cierto, a condición de que las superficies de energía constante sean esféricas. Sin embargo, si las superficies de energía constante se desvían de la forma esférica, la función de densidad de estados se hace mucho más compleja. Para principiar, es importante indicar que los valores permisibles para la cantidad de movimiento del cristal hk, cuando se imponen condiciones periódicas de frontera, de acuerdo con (8.2-20), son los mismos que los valores permisibles de la cantidad de movimiento inercial de una partícula libre, como lo establece (5.2-15). El volumen de espacio de la cantidad de movimiento por estado cuántico, entonces es el mismo que antes y la tarea de determinar la densidad de estados puede lograrse, como antes, encontrando el número de estados cuánticos dv entre las superficies de energía constante correspondientes a las energías e y e +de, calculando el volumen del espacio de la cantidad de movimiento entre las dos superficies y dividiendo entre t/h 3 , el volumen por estado cuántico. El elemento de volumen del espacio de cantidad de movimiento se puede escribir como sigue

h3

dvP

= p2 sen(} dp d(} d
(8.10-1)

por lo cual, el número de estados dentro del volumen es dvP 1 1 dk lh 3 = -4 3 k 2 sen(} dk d(} d
(8.10-2)

El número de estados dv = g( e) de en el rango dt: energía de alrededor de e se obtiene integrando sobre los ángulos polares O y cf> en el espacio k. De donde, 1 ffk 2 sen(} d8 dcp g(e) = 4n: 3 (defdk)

1

f

dSk

= 4n: 3 Js (defdk)'

(8.10-3)

en donde dSk representa el elemento de superficie de área k 2 sen OdO dcf> sobre la superficie de energía constante dentro de la zona de Brillouin. Es evidente que si se conoce la función e(k), la densidad de estados se puede calcular, en principio, a partir de (8.10-3). Sin embargo, desafortunadamente la forma matemática de e(k) es

274

Teoría cuántica de los electrones en redes periódicas

tan compleja en casi todos los casos de interés práctico, que la integración se puede efectuar sólo por métodos númericos. Para la red cúbica simple en la aproximación del enlace firme, la función e(k) para una banda s está dada por (8.7-16) y la densidad correspondiente de la función de estados, según lo establece (8.10-3), es como se ilustra en la figura 8.1 7.

Figura 8.17.

Curva de densidad de estados para una red cúbica simple de acuerdo con la aproximación del enlace firme, como se calculó a partir de (8.10-3) y (8.7-16).

Cerca de la base de la banda de energía de este ejemplo en particular, la forma de e(k) está rlada por (8.8-9); entonces, se tiene, para esta región. de

y

2

dk = 2{Ja k.

(8.10-4)

Puesto que e es independiente de 8 y cp en estas circunstancias, (8.10-3) se puede integrar sobre estos ángulos para que dé

i i"

dk 2 " g(e) = -4 13 k 2 -d sen n eoo

e dO de/> =

k2 2 -d dk , ne

(8.10-5)

o bien, usando (8.10-4),

(8.10-6)

Si se usa (8.7-18) para expresar {Xl 2 en términos de la masa efectiva, esto se puede escribir como g(e)

8~ = _v_ "'-~' m*312J e-e h3

1

(e - e1

~

12{1),

(8.10-7)

que, a condición de que el origen de la energía se tome en la base de la banda, es la expresión parabólica acostumbrada de la densidad de estados de' electrón libre, en donde la masa inercial se ha substituido por la masa efectiva m*. De un modo algo similar, se puede demostrar que para energías cercanas a la parte superior de la

Densidad de la función de estados y cambios de fase

275

banda, en donde las superficies de energía constante vuelven a tener una forma esférica, se puede escribir g(e) =

sJ2n m* 312 J---c-· -¡:;r &1 + 12/3 -

&

(e1

+ 12p - e ~ 12/3).

(8.10-8)

Esta función de densidad de estados se desvanece en la parte superior de la banda, en donde e= e 1 + 12{3, y aumenta parabólicamente para energías decrecientes. En consecuencia, se puede considerar como una función de densidad de estados de partículas libres para conducción por huecos en una banda casi llena. Las funciones de densidad de estados de electrón libre (8.1 0- 7) y (8.1 0-8), se obtuvieron en relación a un ejemplo específico; pero se puede demostrar que se obtienen las mismas expresiones para cualquier estructura cúbica, ya sea que la aproximación de enlace firme se aplique o no. En los metales del grupo de transición, una banda más bien angosta que se origina en los estados atómicos 3d, que alojan a 1ON electrones, se superpone a la banda electrónica de valencia 4s, dando origen a una curva de densidad de estados para los electrones de valencia como la que se ilustra esquemáticamente en la figura 8.18. A esta curva peculiar de densidad de estados se deben muchas de las propiedades características de estos metales.

g(•)

d-Banda

Figura 8.18.

Característica de superposición de las bandas s- y d- de los metales de transición.

La forma de la curva de densidad de estados y el concepto de la superficie de Fermi para los electrones de valencia dentro de la zona de Brillouin, se ha utilizado para explicar ciertos cambios de fase que se relacionan con las aleaciones binarias de cobre, plata y oro con metales divalentes y trivalentes. El cobre, la plata y el oro puros son todos elementos nomovalentes que tienen una estructura cúbica centrada en la cara. Por ejemplo, si se principia con plata pura y se agregan cantidades crecientes de cadmio, la estructura cúbica centrada en la cara que se denomina de fase a se conserva hasta una concentración determinada de cadmio (llamada límite a), que es un punto en el que se produce un cambio de fase y la estructura del cristal cambia de cúbica centrada en la cara a cúbica centrada en el cuerpo, siendo esta última denominada fase (3. Si la concentración de cadmio se incrementa más todavía, la estructura cúbica centrada en el cuerpo de fase (j es estable sobre cierto rango de concentración después del cual se llega a otro punto de transición (denominado límite (j) y la fase (j se transforma en una fase 'Y cuya estructura es un arreglo cúbico muy complejo en el que se tienen aproximadamente 52 átomos por célula unitaria. A concentraciones de cadmio todavía mayores, se llega al límite 'Y y

27 6

Teoría cuántica de los electrones en redes periódicas

se forma una fase hexa~onal 'TI de empaquetamiento compacto. Las aleaciones de otros metales nobles y las que se logran con otros aditivos multivalentes, siguen el mismo patrón general de cambios de fase aunque los límites a:-, {j- y r- son diferentes en cada sistema individual. Hume-Rothery 13 sefialó que los límites a:-, {j- y r- de estos sistemas de aleaciones se producen siempre en ciertas razones bien definidas de electrones de valencia por átomo. En consecuencia, parece ser que el límite {j se alcanza siempre en el punto en el que se tiene justamente alrededor de 3/2 de electrones de valencia por cada átomo del cristal, y el límite 'Y se obtiene a una relación de electrón de valencia por átomo de 21/13. Jones 14 explicó estas observaciones empíricas de acuerdo con las bases fundamentales. En primer lugar, se debe observar que para el metal puro monovalente cúbico centrado en la cara que está en la fase a:, la zona de Brillouin (reducida) para los electrones de valencia es como se indica en la figura 8.14(e). Puesto que los electrone~ de valencia de los metales nobles son de tipo s, se puede esperar que esta zona de Brillouin contenga 2N estados electrónicos. En el caso del metal puro, la zona está llena sólo a la mitad debido a que el número total de electrones de valencia es N, en este caso. Para mayor facilidad se supondrá, como lo supuso Jones, que la superficie de Fermi dentro de la zona es esférica en todo momento. 15 Basándose en esta simple suposición, se puede calcular la curva de densidad de estados para la zona de Brillouin de un modo muy sencillo; el resultado aparece ilustrado de una manera esquemática en la figura 8.19. La función de densidad de estados es, sencillamente, una parábola del electrón libre hasta que la esfera de Fermi toca la frontera de la zona. Sin embargo, a partir de este punto, las fronteras de la zona cortan partes de la esfera de Fermi y un incremento dado del radio (correspondiente a un incremento específico de energía) abarca sólo un número relativamente pequefio de estados en las esquinas de la zona de Brillouin. La curva de densidad de estados decrece con gran rapidez, acercándose a cero cuando el radio de la esfera de Ferrni es igual al radio de la esfera circunscrita. Se puede

La esfera de Fermi ¡-toca la zona de la frontera

Figura 8.19.

Representación de la curva de densidad de estados de la red cúbica simple basada en la idea de la superficie esférica de Fermi que se expande dentro de la zona de Brillouin, tal y como la empleó Jones.

W. Hume-Rothery, The Metallic State, Clarendon Press, Oxford (1931), página 328. H. Jones, Proc. Roy. Soc. 144, 225 (1934); 147, 396 (1934). Véase también N. Mott y H. Jones, op. cit. página 170. 15 Esta suposición es más apropiada en este caso que en el del cubo simple, cuyas superficies de Fermi se ilustran en la figura 8.11, debido a que la zona de Brillouin circundante tiene una forma más esférica. En cualquier caso, la forma exacta de la superficie de Fermi no es particularmente importante para energías TTIIlyores que la que se requiere para que la superficie de Fermi roce apenas la frontera de la zona. 13 14

Densidad de lo función de estados y cambios de fose

277

observar la misma conducta general en la curva de densidad de estados de la figura 8.17, que se relaciona con una red cúbica simple. Cuando los átomos de un metal multivalente forman una aleación con la fase a: monovalente, aumenta el número de electrones libres por átomo, se eleva el nivel de Fermi y también aumenta el radio de la esfera de Fermi dentro de la zona de Brillouin asociada con los electrones de valencia. Más allá del punto en el que la esfera de Fermi toca la frontera de zona, se produce un gran incremento de energía electrónica con cada pequeño incremento de concentración de electrones libres y, por tanto, con cada pequeño aumento en la concentración del aditivo multivalente. En este punto, se obtendrá una energía electrónica total más baja si el cristal sufre un cambio de fase a una red cuya zona de Brillouin dé acomodo a una esfera inscrita de mayor tamaño y, en efecto, esto es lo que sucede. La fase a: cúbica centrada en la cara cambia a una fase (j cúbica centrada en el cuerpo, cuya zona de Brillouin [figura 8.14(b)] tiene, en efecto, una esfera inscrita de mayor tamaño, aunque se trate del mismo volumen. Si se hace una adición posterior del elemento multivalente de la aleación, el radio de la esfera de Fermi aumenta más todavía y por último toca la superficie de la zona de Brillouin de fase (j. Nuevamente se produce un cambio de fase, la zona de Brillouin de la fase 'Y resultante viene a ser un poliedro complejo de 36 caras que tiene una forma más bien esférica 16 que el dodecaedro rómbico asociado con la fase (j y cuya esfera inscrita es, por ende, mayor todavía. De acuerdo con estos argumentos, se pueden hacer cálculos cuantitativos de los límites a:-, (j- y -y-. En la fase a:, la esfera de Fermi llega primero a la frontera de zona en las direcciones {lll} dentro del espacio k. El plano (111) que forma parte del poliedro de la zona de Brillouin tiene [de acuerdo con (8.8-13)], la ecuación

kx +k,+ k,.= 3nfa.

(8.10-9)

En el punto de contacto, en el centro de la cara (111), kx = ky = kz = rra, por lo cual, el radio de la esfera de Fermi es el punto de contacto, kc, debe ·estar dado por (8.10-10) En estas condiciones, el volumen de la esfera de Fermi es 4rrkU3, ó 4 ./frr(rr/a )3, en tanto que se puede demostrar fácilmente que el volumen total de la zona es la mitad del volumen de un cubo de lado 4rrfa, ó 32(rr/a) 3 . La razón del volumen de la esfera inscrita a la zona es, por tanto, la relación de estos dos números, o sea, rr y3/8. El número promedio de electrones de valencia por átomo es el número por átomo cuando la zona está llena (es decir, 2) por la fracción del número de estados dentro de la zona que están ocupados. El número de electrones de valencia por átomo para el límite a: es, entonces, rr y3/4 ó 1.362. Los valores de los límites (j- y -y- se pueden obtener usando los mismos procedimientos generales. En la tabla 8.2 se ilustran los valores obtenidos en comparación con los valores derivados empíricamente por Humes-Rothery. Naturalmente, puesto que las superficies de Fermi no pueden ser perfectamente esféricas, las estimaciones de Jones deben considerarse sólo aproximaciones; sin embargo, se ha encontrado que concuerdan muy bien con los límites de fase determinados de un modo experimental. Los diagramas de fase de sistemas de aleaciones más complejos se entienden a menudo de acuerdo con las superficies de energía 16 Véase F. Seitz, Modern Theory o[ Solids, McGraw-Hill Book Company, Inc., Nueva York (1940), figura 13, página 433.

278

Teoría cuántica de los electrones en redes periódictJS

TABLA 8.2. Relación electrón-átomo Límite de fase

Hume-Rothery·

a

p

y

1.5 1.615

Jones 1.362 1.480 1.538

electrónica y la función de densidad de estados dentro de la zona de Brillouin; pero los detalles de los cálculos y las respuestas resultantes son muy complejas. EJERCICIOS l. Demuestre que si en el modelo del potencial de la figura 8.2, usado en relación con el cálculo de Kronig-Penney, se permite que V0 se haga infinitamente grande y b tienda a cero en tal forma que el producto P =- {j2ab/2 se mantenga fijo, entonces la ecuación (8.3-12) se convierte en

sen aa P-aa

+ cos aa =cuska.

Si se hace una gráfica de la función del lado izquierdo, se observará que se comporta de un modo similar a (8.3-15) y (8.3-16) como se ilustra en la figura 8.3. La cantidad P se puede considerar como la "potencia de dispersión de un solo pico de potencial". 2. Demuestre que en el caso que se vio en el ejercico 1 anterior, la cantidad de/dk desaparece en los bordes de la banda (k = nTr/a ). 3. Demuestre que para la- aproximación unidimensional del electrón libre que se vio en la sección 8.6, de/dk desaparece en los bordes de la banda. 4. Demuestre que para la aproximación de enlace firme en la red cúbica simple que se vio en la sección 8. 7, n • V.e desaparece en todos los puntos sobre las fronteras cúbicas de la primera zona de Brillouin. 5. Demuestre explícitamente que los poliedros que aparecen en la figura 8.14(b) y (e) son las formas correctas correspondientes a la primera zona de Brillouin para las redes cúbica centrada en el cuerpo y cúbica centrada en la cara, respectivamente. 6. Encuentre la relación e(k) para una banda s (funciones de onda esféricamente simétricas) en la aproximación de enlace firme para un cristal cúbico centrado en el cuerpo. Tom,!l·ep cuenta sólo las integrares de superposición del vecino más cercano. Grafique las formas de las superficies de energía constante para varias energías dentro de la zona. Demuestre que estas superficies son esféricas, como sucede en el caso de los electrones libres, para energías cercanas a la base de la banda. Demuestre también que n • v'.e se desaparece;: en las fronteras de la zona. 7. Obtenga todos los resultados que se requieren en el eJercicio 6 anterior, para una banda s en un cristal cúbico centrado en la cara de acuerdo con la aproximación del enlace firme, teniendo .m cuenta sólo la superposición de las funciones de onda del vecino más cercano. 8. Haga un diagrama rsimilar al de la figura 8.13(c)] dentro del plano k, de las primeras cinco zonas de Brillouin de una red bidimensional definida por los vectores de base a aix, b = 3aiy Nota: no se pueden usar las fórmulas (2.5-5) para definrr una red recíproca bidimensional, debido a que el producto transversal no se puede definir en un espacio bidimensional. Proceda a partir de las defmiciones fundamentales (2.5-1) y (2.5-2). 9. Demuestre explícitamente, a partir de los resultados de la sección 8.7, que la densidad de estados cerca de la parte superior de la banda de energía, para el cristal cúbico simple, que se vio en detalle en esa sección, está dada por la ecuación (8.10-8). LO. Demuestre que la relación limitante de electrón de valencia por átomo para la tase (3 (cúbica centrada en el cuerpo) de una aleación binaria del tipo que se vio en la sección 8.10, es 1.489. Puede tomar en cuenta la suposición del cálculo de Iones. 11. Demuestre que la función de onda (8.7-3) que se usó en el cálculo de la aproximación de enlace firme, se puede expresar como una función de Bloch de la forma (8.2-14).

=

Lecturas recomendadas

279

LECTURAS RECOMENDADAS W. Hume-Rothery, The Metallic State, Clarendon Press, Oxford (1931). H. Jones, The Theory of Brillouin Zones and Electronic States in Crystals, North Holland Publishing Co., Amsterdarn (1960). N. F. Mott y H. Jones, Theory of Metals and Alloys, Dover Publications, Inc., Nueva York (1958). S. Raimes, The Wave Mechanics of Electrons in Metals, Interscience Publishers, Nueva York (1961). F. Seitz, Modern Theory of Solids, McGraw-Hill Book Co., lnc., Nueva York (1940). R. A. Smith, Wave Mechanics of Crystalline Solids, John Wiley & Sons, Inc., Nueva York (1961). E. Spenke, Electronic Semiconductors, McGraw-Hill Book Co., Inc., Nueva York (1958). A. H. Wilson, Theory of Metals, 2.a Edición, Cambridge University Press, Nueva York (1953).

CAPITULO

9

Semieonductores electrónicos unifortnes en equilibrio

9 .l

SEMICONDUCTORES

En los capítulos anteriores la preocupacwn principal consistía en entender las propiedades eléctricas y térmicas de los conductores y los aisladores metálicos, así .:omo comprender por qué unas substancias son muy buenos conductores eléctricos y otras, muy deficientes. Estos objetivos se han logrado en general y, a partir de ahora la atención se centrará en un análisis detallado de las propiedades de los semiconductores. Hay tres razones por las que esto es algo muy conveniente. En primer lugar casi siempre se puede usar la estadística de Maxwell-Boltzmann para estudiar la mecánica estadística de los portadores de carga en semiconductores. Esto significa que se pueden obtener soluciones analíticas exactas para muchos problemas de semi.:onductores que se pueden resolver sólo mediante métodos numéricos o aproximados en el caso de los metales, en donde se debe utilizar la estadística de Fermi-Dirac. Comprender los efectos de esta índole en los semiconductores puede proporcionar .:onocimientos físicos valiosos respecto a sus equivalentes en substancias metálicas. En resumen, los procesos electrónicos se pueden comprender con mayor facilidad y profundidad en los semiconductores que en otras clases de cristales. En segundo lugar, la tecnología del crecimiento de cristales ha hecho posible producir cristales de ciertas substancias semiconductoras (principalmente germanio y silicio) de una pureza y perfección cristalina fantásticas, en un grado mucho mayor de lo que se puede vbtener en la actualidad con metales y aisladores. La existencia de estos cristales casi perfectos permite al experimentador observar las propiedades de transporte electrónico, los efectos termoeléctricos y galvanométricos con facilidad y precisión, teniendo la certeza de que lo que está tratando de observar no lo oscurecerán los efectos provocados por impurezas o imperfecciones estructurales en la red cristalina. Por tanto en los semiconductores se pueden observar e interpretar con facilidad los fenómenos que, en las substancias metálicas, serían difícil o imposible medir con precisión o explicar de un modo cuantitativo. Por último, los semiconductores han adquirido una enorme importancia tecnológica durante las dos últimas décadas. Se han llegado a utilizar para fabricar todo tipo de dispositivos electrónicos incluyendo rectificadores, transistores, fotoceldas, reguladores de voltaje, amplificadores paramétricos y dispositivos de conmutación. La apreciación de las propiedades fundamentales del transporte electrónico en estas substancias tiene una aplicación directa en la comprensión y el análisis del funcionamiento de todas las estructuras de dispositivos que actualmente tienen importancia técnica. 281

282

Semiconductores electrónicos uniformes en equilibrio

El semiconductor es una substancia cristalina que tiene una estructura de bandas de energía en la que una banda de estados electrónicos, completamente llena a la temperatura cero, se separa de otra que está totalmente vacía al cero absoluto. por medio de una región angosta de energías prohibidas. Esta estructura de banda se ilustra esquemáticamente en la figura 9.l(a). En el cero absoluto, el semiconductor es un aislador perfecto, ya que no cuenta con bandas parcialmente llenas. Sin embargo, a temperaturas más altas, algunos electrones de la banda de valencia pueden adquirir la suficiente energía térmica aleatoria para excitarse a través de la banda prohibida con el fin de convertirse en electrones de conducción en la banda de conducción que hasta entonces estaba vacía. Los estados vacíos que quedan en la banda inferior o de valencia pueden contribuir también a la conductividad comportándose como huecos positivamente cargados. Fs evidente que el número de electro-

Electrones de conducción / _ térmicamente excitados

Banda "de conducción" vacía

-

~e~~~-----------

t:u

Región prohibida (Banda de energía prohibida)

(o) 0°K

Figura 9.1.

Estados vacíos de la banda de valencia (huecos) ( b) Temperatura ambiente (300° K)

Bandas de conducción y valencia de un semiconductor (a) al cero absoluto, (b) a la temperatura ambiente, mostrando electrones y huecos térmicamente excitados.

nes de conducción y el número de huecos debe elevarse al incrementarse la temperatura y, por tanto, la conductividad eléctrica también aumenta al subir la temperatura. El mecanismo físico de la conducción por electrones y huecos en semiconductores covalentes, tales como el carbono (diamante), germanio y silicio, que forman cristales con la estructura del diamante de la figura 1.9, se puede entender con mayor claridad en la figura 9.2. En esta figura se muestra la estructura calculada de bandas de energía del diamante graficada en función del espaciamiento interatómico, como se hizo en la figura 8.1 O. Los diagramas correspondientes al silicio y al germanio son muy similares. Cuando N átomos aislados se combinan en un cristal, los niveles atómicos 2s y 2p se amplían a bandas de energía; conforme el espaciamiento interatómico disminuye, estas bandas se hacen cada vez más anchas y terminan por superponerse. Cuando la distancia interatómica se hace más pequeña todavía, el continuo de lo que originalmente eran los estados 2s y 2p se divide una vez más en dos bandas, cada una de las cuales cuenta ahora precisamente con 4 N estados. A la distancia interatómica de equilibrio a, estas bandas están separadas por un "vacío de energía" o región prohibida cuya anchura es ll.e. Puesto que la estructura electrónica del carbono es ls 2 )2s 2 2p 2 , se tienen 4 N electrones de valencia disponibl.- que bastan exactamente para llenar la más baja de las dos bandas y formar la banda de valencia del cristal. La banda superior se convierte en la de conducción. La región de energía prohibida en condiciones normales tiene una anchura aproximada de 7 e V en el diamante, 1.2 eV en el silicio y 0.7 eV en el germanio. Debido a la expansión

Semiconductores

tu=7eV 1

283

(Diamante)

z'ev '(Silicio! (Germanio)

~~~--~6~N~es~t-ad~o-s-+ 2 P

>Niveles átómicos ffiin:s:o-2~N~e-,st-ad-¡-o-s---¡.

2•

\~nD~=-------------~2~N~e~s~ta~d~o~s---t'• -----+--:---::-:----:---::-::-:---------;;;;t- _

a(= Valor de equilibrio del diamante)

Figura 9.2.

00

Espaciamiento interatómico

Las bandas que se originan de los estados atómicos ls, 2s y 2p del carbono (diamante) como función de la distancia interatómica. [De acuerdo con W. Shockley, Electrons and Holes in Semiconductors, D. van Nostrand Co., lnc., Nueva York (1950).]

ténnica de la red, este "vacío de energía" tiene una dependencia débil en función de la temperatura; de acuerdo con la figura 9.2, es evidente que el vacío en la energía disminuye confonne se expande el cristal. También es obvio, de acuerdo con este diagrama, que A. e. será una función de la presión, haciéndose mayor confonne se reduce el espaciamiento interató!llico mediante la aplicación Je presión por medios hidrostáticos o de otra naturaleza. Más a la izquierda del punto A de la figura 8.10, en donde se superponen las bandas ls y 2s, se pierde el carácter s y p de los estados electrónicos; por tanto, en la banda de valencia del semiconductor, las funciones de onda del electrón son una mezcla de funciones de onda atómicas s y p. Los electrones de la banda de valencia son los que fonnan los enlaces covalentes de parejas de electrones tetraédricamente dispuestos entre los átomos, en la figura 1.9. La excitación ténnica de un electrón de la banda de valencia a la de conducción corresponde físicamente a la supresión de un electrón de la pareja del enlace covalente por medio de la agitación ténnica de la red. Por tanto, el electrón se convierte en un electrón libre fuera del enlace covalente de la red y queda disponible para funcionar como portador de carga a fin de conducir una corriente a través del cristal. Este proceso se describe esquemáticamente en la figura 9.3(a), aunque se debe recordar que el patrón de enlaces usado es una versión bidimensional de lo que en realidad es una red tridimensional de enlaces tetraédricos. la excitación de un electrón deja un defecto localizado en la estructura del enlace covalente del cristal, que se puede identificar como un estado de banda de valencia que podría ser ocupado por un electrón; pero que en realidad está vacío. Este defecto constituye el "hueco" de la sección 8.5. Tanto el electrón libre como el hueco son migratorios; el electrón libre puede ''vagar" dentro del cristal en una fonna aleatoria, impelido por la energía ténnica que pueda adquirir de la propia red. Del mismo modo, el hueco puede desplazarse porque un electrón de un enlace covalente adya~ente al hueco puede moverse con suma facilidad hacia el hueco, completando así la pareja de enlace en el sitio original del hueco; pero transfiriendo la ubicación del hueco al

284

Semiconductores electrónicos uniformes en equilibrio

sitio de donde provino el electrón. Esta migración del hueco también puede producirse por una agitación térmica de la red. Los electrones libres y los huecos se moverán también en respuesta a un campo eléctrico y pueden dar origen a una corriente macroscópica que fluye por el cristal. En la figura 9.3(b) se ilustra esta situación. En este caso, todos los electrones del-cristal, tanto en la banda de conducción como en la de valencia están sometidos a la fuerza - eE que actúa a la derecha del diagrama. Los electrones libres se mueven hacia la derecha produciendo un flujo de corriente convencional a la izquierda, debido a su carga negativa. Además un electrón de un enlace covalente adyacente a un hueco se puede desplazar a la derecha hacia el sitio vacío del electrón asociado con él, y el hueco se desplaza hacia la izquierda al sitio de donde provino este electrón; este proceso se puede repetir y el resultado neto es una transferencia neta de un electrón hacia la derecha que va acompañada del movimiento del hueco hacia la izquierda, es decir, en la 11

11

11

11

11

=@=@=@=@=@= 11 11 11 11 11 =@=@=@=@=@= 11 11 e11 11 11 =@=@-@=@=@= 11 11 11 11 11 =@=@=@=@=@= 11 11 11 11 11 =@=@=@=@=@= 11

11

11

11

_.11

11

11

11

"

=@j~'~@=@=@= 11

11

11

11

11

=@=@=@=@=@= 11 11 11 11 11 @=@=@=@=@= 11

Electrones de _.....-. enlace covalente (o)

Figura 9.3.

11

=@=@=@=@=@= 11 11 11 11 11 =@=@=@=@=@= 11 ll ()¡¡---iT-e 11

11

11

11

11

-E

(b)

(a) Un electrón libre y un hueco producidos por la ionización térmica de un electrón que originalmente se encontraba en un enlace covalente. (b) Movimiento del electrón libre (a la derecha) y el hueco (a la izquierda) cuando se aplica un campo eléctrico tal y como se indica.

dirección en que la partícula de carga positiva se movería bajo la influencia de un campo aplicado. La corriente neta de electrones hacia la derecha da origen nuevamente a un flujo convencional de corriente hacia la izquierda que puede representarse como una corriente de huecos positivos en tal dirección. Así pues, el flujo de la corriente puede deberse tanto al movimiento de electrones libres como a la migración de electrones de valencia dentro y fuera de estados vacíos de la banda de valencia, que se puede considerar mejor como la migración de huecos positivos.

9.2 SEMICONDUCTORES INTRINSECOS Y SEMICONDUCTORES CON IMPUREZAS

Un semiconductor en el que los huecos y los electrones se crean exclusivamente mediante una excitación térmica a través de la banda prohibida de energía, se conoce como semiconductor intrínseco. Los huecos y los electrones creados de esta

Semiconductores intrínsecos y semiconductores con impurezas

28S

manera a menudo se denominan portadores intrínsecos de carga y la conductividad originada por estos portadores se llama conductividad intrínseca. En un semiconductor intrínseco, las concentraciones de electrones y huecos siempre deben ser las mismas, ya que la excitación térmica de un electrón origina inevitablemente sólo un hueco. La población de huecos y electrones en un semiconductor intrínseco se describe estadísticamente de acuerdo con la función de distribución Fermi-Dirac y las funciones de densidad de estados para las bandas de valencia y conducción. Puesto que la parte baja de la banda de conducción y la parte superior de la de valencia muestran una dependencia esencialmente parabólica de su relación e y k, el comportamiento de los electrones y los huecos en estas regiones es fundamentalmente el de una partícula libre, con los factores apropiados de masa efectiva. Los electrones y los huecos se ven raramente excitados hacia las regiones de las bandas de conducción y valencia en donde sus propiedades pueden diferir del comportamiento de una partícula libre a temperaturas físicamente posibles de manera que los efectos de estas excitaciones se pueden desechar para fines prácticos. Entonces, las funciones de densidad de estados que se van a usar son en esencia las de las partículas libres y la densidad de estados de la banda de conducción está dada por ge(e) de=

sJh32n m* n

312 Je

-ee de

(9.2-1)

y la densidad de estados de la banda de valencia es g v( e) de=

312 Sj2n h3 m*P V ~de t>v- t '

(9.2-2)

m;

en donde m~ es la masa efectiva de los electrones de la banda de conducción y es la masa efectiva de los huecos de la banda de valencia. 1 Por supuesto, la densidad de estados en la región prohibida ev <e < ec es cero. En la figura 9.4 aparece una gráfica de la curva de densidad de estados correspondiente a un semiconductor intrínseco. Si y m~ son precisamente iguales, la energía de Fermi debe quedar

m;

Figura 9.4.

Función de densidad de estados de un semiconductor intrínseco.

1 Los subíndices n y p se refieren a los portadores de carga negativos y positivos. Esta regla se aplicará de un modo invariable.

286

Semiconductores electrónicos uniformes en equilibrio

exactamente en el centro de la región prohibida. Esto es lo correcto debido a que. de otra manera, la población de electrones en la banda de conducción y los huecos de la banda de valencia, obtenidos integrando el producto de la función de densidad de estados y el factor de probabilidad f 0 (e) para los electrones en la banda de conducción, ó 1 - f 0 (e) para los huecos en la banda de valencia, no sería idéntica. La situación se representa diagramáticamente en la figura 9.5(a). Si y m~ no son iguales (y este es el caso general), la energía de Fermi debe sufrir un pequeño ajuste ascendente o descendente, alejándose del centro exacto de la banda prohibida de energía, para igualar las integrales de población y, por tanto, debe quedar cerca, pero no en el centro de la región prohibida. En la figura 9.5(b) se muestra esta circunstancia. En una sección posterior se investigará más detalladamente la estadística de huecos y electrones.

m;

·t Probabilidad de ocupación de electrones

-fo(•l g(•l 1 1 1---uc<•l

1

1 1

f0

1

_Producto f0 (. l9c(• l

.,

.,

.... Producto [1-f0 (•l]uv<•l

....

Probabilidad 1- t0 para huecos

''

''

9v<•l f 0 =0

(o) m~ =m~ Figura 9.5.

'/' ,

1 1

2

(b) m*p =m*,

Función de distribución, nivel de Fermi, función de densidad de estados y poblaciones de electrones y huecos de un semiconductor intrínseco (a) en donde =m~ y (b) en donde >m~. Ui "ampliación" de la distribución de Fermi se ha exagerado aquí para ilustrar con mayor claridad; en realidad, a 300°K, la distribución de Fermi sería más bien como la función "escalón" que se encuentra para T=O.

mp

mp

Es muy fácil introducir cantidades muy pequeñas de substancias tales como arsénico, antimonio u otros elementos pertenecientes al grupo V de la tabla periódica, en cristales puros de silicio o germanio, como impurezas de substitución, es decir, como átomos de impurezas que ocupan sitios de la red que normalmente estarían ocupados por átomos del semiconductor covalente. Los átomos del grupo V tienen cinco electrones de valencia. Cuatro de ellos se usan para formar enlaces covalentes con átomos circunvecinos del semiconductor y el quinto se enlaza al átomo de impureza sólo mediante fuerzas electrostáticas que son muy débiles y, por ende, se pueden ionizar con facilidad mediante la agitación térmica de la red a

Semiconductores intrínsecos y semiconductores con impurezas

287

temperaturas ordinarias para proporcionar una conducción electrónica adicional. Entonces, el átomo de impureza que queda se convierte en un ion positivo, que, sin embargo, es inmóvil, en vista de que está fuertemente unido a cuatro átomos vecinos por medio de los enlaces covalentes normales. Esta situación se ilustra en la figura 9.6(a). En cristales que contienen este tipo de impureza existen más electrones que huecos (aunque algunos huecos siguen estando presentes debido a los pares hueco-electrón que se siguen creando térmicamente de vez en cuando). Estos cristales se denominan semiconductores tipo n, designados así porque la mayoría de los portadores de carga son electrones negativos. La componente de la conductividad eléctrica que se produce por los átomos impureza se llama conductividad de impureza. Una substancia cuya mayoría de portadores se origina debido a átomos de impureza, se conoce como semiconductor con impurezas. Los átomos del grupo V de substitución se llaman con frecuencia átomos donadores, ya que cada uno de ellos dona un electrón libre adicional al cristal. Se requiere tan poca energía (como se verá en breve) para ionizar un átomo de impureza donadora típico del grupo V en Si y Ge, que prácticamente todas las impurezas del grupo V en estos materiales se ionizan a temperaturas superiores a aproximadamente 20°K.

11

hbre

11

11

11

11

11

11

11

=@=@=@=®= Hueco---¡¡"'

=@=@~@=@=

=@~@=@=@= ' ,t 11 11 11 =®=@~CGt=@=

11

11

11

11

11

11

11

' ~.

11

=@=®=(e/=@= 11 11 =@=@=@=@= (a)

Figura 9.6.

11

11

=@ =@ =@ = O..,l.l

~lectrón =~

11

(tipo·n)

11

1

11

11

11

'~u

11

11

=®=®=@=@= 11

11

(b)

11

11

(tipo-p)

(a) Electrón libre originado por la ionización de un átomo de impureza de arsénico de substitución, (b) hueco libre producido por la ionización de un átomo de indio de impureza de substitución.

Si en lugar de los átomos del grupo V se introducen en la red átomos de impurezas del grupo lli (Al, Ga, In, etc.), se observará un efecto muy distinto. Estos átomos tienen sólo tres electrones de valencia que se usan para formar enlaces covalentes con tres átomos cercanos; pero el cuarto enlace siempre carece de un electrón. En efecto, existe un hueco adicional que se crea en la estructura del enlace covalente en el átomo de la impureza. Este hueco puede emigrar fácilmente alejándose del sitio de la impureza debido a que un electrón adicional del enlace covalente cercano puede emigrar al sitio de la impureza y llenar el cuarto enlace de par de electrones (que, por supuesto, representa una carga negativa en el átomo de impureza); a continuación, el hueco se asocia con el átomo cercano que no se puede distinguir de un hueco térmicamente formado. En la figura 9.6(b) se ilustra esta situación. La energía necesaria para la migración del hueco lejos del sitio de la impureza es del orden de la energía que se requiere para eliminar el electrón adicional de un átomo donador. En consecuencia, excepto a temperaturas muy bajas, todos los huecos serán migratorios y todos lo átomos de impurezas del grupo IIl tendrán la naturaleza de iones negativos inmóviles. En cristales que contienen predominantemente este tipo de impureza se tienen más huecos que electrones, aunque

288

Semiconductores electrónicos uniformes en equilibrio

.t

·t lectrones Electrones

.,_-+-_ Nivel de Fermi intrínseco-

Nivel de F

-"----

.,

Huecos

fo=

o

(a) tipo-n Figun 9.7.

fo= O

( b) tipo-p

Función de distribución nivel de Fermi y poblaciones de electrones y huecos para (a) un semiconductor con impurezas tipo n y (b) un semiconductor con impurezas tipo p. Una vez más, como en la figura 9.5, la "ampliación" de la distribución de Fermi se exagera con fines ilustrativos.

siempre habrá algunos electrones que se originan debido a la excitación térmica. Los cristales de esta índole se conocen con el nombre de semiconductores tipo p, dado que los portadores de carga mayoritarios son positivos. Los átomos de substitución del grupo III se clasifican casi siempre como átomos receptores, debido a que pueden recibir un electrón de la -estructura del enlace covalente liberando un hueco móvil. Cuando en un cristal semiconductor existen impurezas de ambos tipos, la conductividad es invariablemente mayor que la referente a un semiconductor puro o intrínseco a la misma temperatura, debido a los portadores .1e carga lldicionales originados por los átomos de impurezas y, en general, mientras más grande es 1~ concentración de impurezas, tanto mayor es la conductividad. La representación estadística de los semiconductores tipo n y p se caracterizan por la presencia del nivel de Fermi superior (para el tipo n) o inferior (para el tipo p) a la posición asociada con el cristal puro o intrínseco. Por ejemplo, en un cristal tipo n, no puede haber más electrones que huecos, a menos que el nivel de Fermi se ajuste de un modo ascendente en relación con la posición intrínseca, y viceversa para el tipo p, como se ilustra en la figura 9.7. Conforme varían la temperatura y la concentración de impurezas, la posición del nivel de .Fermi cambia de un modo muy complejo. Este tema se ampliará más adelante.

9.3

ESTADISTICA DE HUECOS Y ELECTRONES; EL CASO DEL SEMICONDUCTOR INTRINSECO

En condiciones de equilibrio térmico, el número de electrones dn 0 por unidad de volumen que tienen una energía dentro del rango de alrededor de e en la banda

Estadística de huecos y electrones; el caso del semiconductor intrínseco

289

de conducción de cualquier semiconductor, intrínseco o con impurezas, de acuerdo con los resultados del capítulo 5, es d n0 --

f ( ) ( ) 10 e 9c e

d S--

sJ2.n mn*3/2 J~!.....!!de ----¡;:r-

(9.3-1)

1 +e kT en donde f 0 (e) representa la función de distribución de Femli en equilibrio (5.5-20) y gc(e) es el factor de densidad de estados (9.2-1). Ahora, ~€, la anchura de la región de energía prohibida, es casi siempre del orden de 1 eV y kT a la temperatura ambiente (300°K) es aproximadamente 1/40 eV. Si la energía de Fermi está dentro de la región prohibida, a varias unidades kT lejos del borde de la banda de conducción (es decir, si €e- e¡'> kl), entonces para todas las energías pertenecientes a la banda de conducción, el factor exponencial del denominador de la función de distribución de Fermi es mucho mayor que la unidad. Por tanto, la función de distribución de Fermi se puede representar en relación con la banda de conducción como

fo(s)

~

e-(e-e¡)/kT

(9.3-2)

que es una función de distribución con una forma esencialmente maxwelliana. La situación en este caso es prácticamente la que se vio en el capítulo 5 en conexión .:on la ecuación (5.5-27). Puesto que ya se indicó en la figura 9.5 que la energía de Fermi para un semiconductor intrínseco debe quedar dentro de la región prohibida de energía, y dado que kT ~ ~€ a todas las temperaturas accesibles, como se señaló mtes, la condición €e- e¡'> kT se satisface siempre en la práctica y siempre se puede utilizar la expresión (9.3-2) para semiconductores intrínsecos mejor que la que es más complicada, (5.5-20). En realidad, en la mayoría de los casos relacionados .:on semiconductores con impurezas, se descubrirá que esta condición se satisface, lo .:ual también permite utilizar (9.3-2) para estos semiconductores. Por ejemplo, es evidente que esta simplificación sería válida para los semiconductores con impurezas de la figura 9. 7. En las figuras 9.5 y 9. 7 se puede ver que la "cola" exponencial de la función de distribución de Fermi es la única parte de dicha función que tiene una superposición con las bandas de c0nducción y valencia. La parte de la función de Fermi en las cercanías de la energía de Fermi, que es invariablemente la parte que origina dificultades matemáticas, coincide en todos los casos con una región en dor.de la densidad de los estados electrónicos disponibles es cero. La aproximación de simplificación (9.3-2) se conoce con el nombre de aproximación de Boltzmann. Si se utiliza esta aproximación en (9.3-1) y se integra para obtener el número total de electrones por unidad de volumen en la banda de conducción, se encuentra .:¡ue

nO =

I

00

~

dn O

J = -8 2n.

h3

I

00

m*3f2 n

e•¡lkT

--

Je-e e e-•tkT de ·

(9.3-3)

~

En realidad, los límites de integración deben ser desde Ee hasta la parte supenor de la banda de conducción, sea donde fuere; sin embargo, puesto que !o(€) desciende muy rápidamente al incrementarse e (-por lo menos para valores razonables de temperatura), la mayoría de los electrones se concentran en los estados cercanos J. la base de la banda de conducción. En tanto que la parte superior de la banda tenga una energía muchas unidades kT mayor que Ee, no hay mucha diferencia en el

290 Semiconductores electrónicos uniformes en equilibrio hecho de si se integra a la parte superior de la banda o a infmito. Cuando se hace la substitución ¡;-Be X=-e kT

(9.3-4)

la integral (9.3-3) se puede expresar en la forma (9.3-5)

De acuerdo con (5.4-4), el valor de la integral antenor es r(3/2) = y1r/2. Si se substituye e.ste valor para la integral, el resultado sería (9.3-6)

en donde (9.3-7)

El valor numérico de la cantidad Uc se puede escribir (usando las unidades cgs) como (9.3-8)

en donde m 0 es la masa inercial del electrón. Para m:; = rn 0 y T = 300°K, esto da Uc = 2.51 X 10 19 cm- 3 . El número de huecos Po por unidad de volumen en la banda de valencia de un semiconductor, se puede encontrar de un modo similar. En este caso se puede expresar como dp 0 , el número de huecos en la banda de valencia dentro del rango de energía de alrededor de e, (9.3-9)

La cantidad [po(e) es la probabilidad de que un hueco esté asociado con un estado cuántico de energía e, en otras palabras, que dicho estado estará desocupado. Esta probabilidad es justamente, uno menos la probabilidad de ocupación f 0 (e). Puesto que [ 0 (e) está dada por (5.5-20), se puede ver fácilmente que 1

/po(e) = 1-/o(e) = 1 - 1 + e<•

.,J!kT -

1

+ e<•'

•JikT.

(9.3-10)

Nuevamente, si la energia de Fermi tiene varias unidades kT por encima del borde de la banda de valencia, es decir, si e¡- Ev ~ kT, el factor exponencial del denominador de la expresión (9.3-10) ¡;s mucho mayor que la unidad, para todos los valores de e en la banda de valencia, se puede hacer que (9.3-11)

Esta es la aproximación de Boltzmann para los huecos en la banda de valencia. Si se usa (9.3-11) y la función de densidad de estados (9.2-2) en (9.3-9) y se i,r.tegra

Estadística de huecos y electrones; el caso del semiconductor intrínseco

291

sobre la banda de valencia, se obtiene (9.3-12)

También en este caso el límite inferior de la integral es - oo y no la base de la banda de valencia; esta simplificación se justifica más o menos con el mismo argumento que se usó en relación (9.3-3) para la banda de conducción. Cuando se hace la substitución 8v-

e

X=--

kT

v

(9.3-13)

la integral se puede expresar en la forma (9.3-14)

que se puede evaluar como una función

r-,

como antes, para dar (9.3-15)

con (9.3-16)

El valor numérico de Uv puede obtenerse a partir de (9.3-8), substituyendo en la fórmula mp por m~.' Se puede demostrar con facilidad que el producto m 0 p 0 es una función exclusiva de la banda prohibida de energía t:.e, las masas efectivas y la temperatura, e independiente del nivel de Fermi o del contenido de impurezas. Por tanto, al multiplicar las expresiones (9.3-6) y (9.3-15) para n 0 y p 0 , ~e puede obtener (9.3-17)

Si se usa (9.3-7) y (9.3-16), esto se puede escribir en la forma (9.3-18)

Para una substancia semiconductora dada, las masas efectivas y la banda prohibida de energía ~e son fijas; de donde, el producto n 0 p 0 de un material dado debe ser una función exclusiva de la temperatura. Esta es esencialmente una ley de acción de las masas que rige las concentraciones relativas de huecos y electrones en un material en particular. Si el semiconductor se encuentra en un estado intrínseco o puro, las concentraciones de huecos y electrones deben ser iguales, como se vio antes, debido a que sólo los huecos y los electrones que pueden estar presentes son los que se generan en pares mediante la excitación térmica de los electrones de la banda de valencia. En consecuencia, en este tipo de materiales,

Po

= n0 = n¡(T)

(9.3.19)

292 Semiconductores electrónicos uniformes en equilibrio en donde n¡(T) representa el número de huecos o electrones por unidad de volumen dentro de una muestra intrínseca del semiconductor en cuestión a la temperatura T. En una muestra de la misma substancia que no es intrínseca, sino más bien un semiconductor con impurezas, el número de huecos y electrones ya no es el mismo: sin embargo, de acuerdo con (9.3-17), el producto n 0 p 0 debe ser el mismo para este material que para la substancia intrínseca. Por tanto, se puede escribir, de acuerdo con (9.3-19), (9.3-20) siendo (9.3-21) como lo establece (9.3-18). De acuerdo con estos resultados, la concentración de portadores en un semiconductor intrínseco tiene una gran dependencia de la temperatura, aumentando rápidamente conforme se incrementa esta última y, de igual manera, depende enormemente de la banda prohibida de energía Lle, decreciendo con gran rapidez al aumentar Lle. La relación de la acción de las masas (9.3-17) ó (9.3-20) recuerda claramente las leyes que gobiernan las concentraciones relativas de iones en substancias que están débilmente ionizadas, por ejemplo, los iones H+ y OH- en sistemas acuosos. En realidad los semiconductores se pueden comprender como un ejemplo de la teoría clásica de Arrenhius sobre los electrolitos débilmente ionizados en relación con un sistema en el que un enlace covalente se disocia en un electrón y un hueco con la energía de disociación Lle. En una muestra puramente intrínseca, en donde las concentraciones de huecos y electrones son iguales, se pueden igualar las expresiones (9.3-6) y (9.3-15), tomar el logaritmo de ambos lados de la ecuación resultante y resolver para la energía de Fermi, lo cual da (intrínseca).

(9.3-22)

Puesto que Uv y Uc están dadas por (9.3-16) y (9.3-7), se puede expresar este resultado en la forma (intrínseca),

(9.3-23)

usando el símbolo e¡¡ para denotar la energía de Fermi de un semiconductor intrínseco. De acuerdo con esto, es evidente que en un semiconductor intrínseco la energía de Fermi queda desplazada del centro del vacío de energía sólo por una cantidad relativamente pequeña de energía, según lo indica el segundo término del lado derecho de (9.3-23). Si m;= m~, el nivel de Fermi se encuentra exactamente en el punto medio de la región prohibida, como sr señaló con anterioridad.

9.4

ENERGIA DE IONIZACION DE CENTROS DE IMPUREZAS

Un centro donador de un semiconductor se compone de un icn fijo de carga

+e con el que está enluado débilmente un electrón. Si la energía de enlace es lo

Energía de ionización de centros de impurezas

293

suficientemente pequeña, la "órbita" del electrón será tan grande en comparación con el espaciamiento interatómico, que la trayectoria del electrón alrededor del ion donador 2 abarcará muchos átomos. En estas circunstancias, es correcto pensar que el electrón está sumergido en un medio uniforme polarizable cuya constante dieléctrica K, es la constante dieléctrica macroscópica del cristal semiconductor, ya que la fuerza electrostática entre el ion donador y el electrón entonces se modificará en promedio, por la polarización de los muchos átomos que intervienen. La representación es similar a la de un átomo de hidrógeno dentro de un medio uniforme continuo, cuya constante dieléctrica es " si se puede imaginar esta situación. Esta representación será válida siempre y cuando K tenga tal magnitud que las órbitas de Bohr sean grandes en comparación con el espaciamiento interatómico. Ahora se puede calcular el tamaño de las órbitas y los niveles de energía asociados de acuerdo con la teoría de Bohr que se vio en la sección 4.5. Sería más exacto usar la mecánica ondulatoria del átomo de hidrógeno para estos cálculos; pero puesto que se sabe que la teoría de Bohr y el promedio de la mecánica ondulatoria de las distancias nucleares electrónicas son casi las mismas, se puede confiar en que la teoría simple de Bohr dará respuestas adecuadas para esta situación que es muy similar. La condición de cuantización para la cantidad de movimiento angular orbital se aplica en ambos casos, de modo que la ecuación (4.5-2) sigue siendo correcta, a condición de que la masa electrónica se substituya por m~. Por otra parte, debido a la polarización del cristal, la fuerza electrostática entre el ion donador y el electrón enlazado se reduce en un factor ", haciéndose e2 /Kr~, de tal manera que la ecuación (4.5-3) ahora se debe escribir como sigue (9.4-1) A continuación, las ecuaciones (9.4-1) y (4.5-2) se pueden resolver como ecuaciones simultáneas para rn y wn, dando [(en analogía con (4.5-4) y (4.5-5)], (9.4-2) y

m:e

4

Wn=~li3 2

n

K

(9.4-3)

Las energías cinética y potencial ahora se pueden evaluar como se hizo en (4.5-6) y (4.5-7), recordando, sin embargo, que la energía potencial ahora está dada por - e2/K.rn, por lo cual la energía total es (9.4-4) La teoría de Bohr para el átomo de hidrógeno se expresa mediante las ecuaciones anteriores con m~= m 0 y K = l. De acuerdo con (9.4-2), es ev.idente que las

2 Aunque describe la situación, esto no constituye un buen lenguaje de mecánica cuántica; sería más exacto decir que la función de onda del electrón se extiende sohre muchas distancias interatómicas, de tal manera que se incluyen muchos átomos dentro de la región en donde la densidad de probabilidad es grande.

294

Semiconductores electrónicos uniformes en equilibrio

órbitas de Bohr para el centro donador son más grandes que las órbitas del hidm. geno por un factor K y también por un factor m 0 /m~. Para el germanio tipo 11. K= 16 y m~~ m 0 /4, de tal manera que el radio de la primera órbita de Bohr es 64 veces el radio de la primera órbita de Bohr del hidrógeno. El valor del hidrógeno ea 0.528A, de tal suerte que el valor para el átomo donador en el germanio es alredodor de 34 A. En efecto, esto es considerablemente mayor que la distancia interátomica (que es más o menos 2.44A para el germanio), de donde, esta representaciÓII del centro donador está justificado en este caso desde el punto de vista físico. La energía de ionización del centro donador, de acuerdo con (9.4-4), es menor que la del átomo de hidrógeno por un factor 1/K 2 y también por un factor m~/m 0 • Para el caso del germanio, esto representa (1/256) • (1/4) = 1/1024. Entonces, podría esperarse que la energía de ionización para el estado basal de un átomo donador sea aproximadamente 1000 veces menor que la del estado basal del átomo de hidrógeno (13.6 eV). En consecuencia, se llega a la cantidad 0.013 eV para la energía de ionización de un átomo donador en el germanio. Este valor concuerda aceptablemente con los valores determinados en la práctica y que se obtuvieron por la medición de concentraciones de portadores en función de la temperatura y por la absorción óptica en el infrarrojo, según lo indica la tabla 9.1. Los valores más elevados de energía de ionización observados para el silicio, se explican en parte por la constante dieléctrica menor (K = 12) de este material, y en parte por las masas efectivas más grandes de los electrones del silicio. Las características de los centros receptores se pueden comprender siguiendo el mismo razonamiento, utilizando una representación que comprenda un ion receptor negativamente cargado y un hueco de carga positiva dentro de un medio dieléctrico uniforme. TABLA 9.1. Energías de ionización de centros donadores y receptores en Ge y Si Impureza

Ge

p As Sb

0.012 eV 0.0127 0.010

0.045 eV 0.05 0.039

B Al Ga In

0.0104 0.0102 0.0108 0.0112

0.045 0.06 0.07 0.16

Si

Por tanto, se puede considerar que los electrones cedidos por átomos donadores se originan en estados donadores localizados dentro del vacío de energía prohibida, a unas cuantas centésimas de electrón volt por d•bajo de la banda de conducción. De igual manera se puede considerar que los huecos cedidos por los átomos receptores se crean cuando los electrones, que normalmente deberían ocupar los estados cercanos a la parte superior de la banda de valencia, se desplazan a niveles receptores que estaban vacíos en un principio, y cuya energía se localiza a unas cuantas centésimas de electrón volt por encima de la banda de valencia. Este patrón de niveles donadores y receptores se ilustra en la figura 9.8(a). La representación correspondiente de la densidad de estados aparece en la figura 9.8(b).

Estadística de los semiconductores con impurezas E

•e

t

295

Banda de conducción Electrones _ / de conducción

""'""'~-=--=-~:.__-=---

Ee

----~Niveles donado::s

...

Electrones de la banda de valencia que ocupan los niveles receptores f /Niveles _ _ _ _¿ _ r~eptores •.,

••

••

L

Banda de valencia (a)

Figura 9.8.

9.5

(b)

(a) Diagrama de bandas de energía de un semiconductor con impurezas indicando los niveles donador y receptor, (b) curva correspondiente a la densidad de estados.

ESTADISTICA DE WS SEMICONDUCTORES CON IMPUREZAS

Antes de estudiar la mecánica estadística verdadera de los semiconductores con impurezas, es necesario examinar una característica sutil de la estadística de ocupación de los niveles donadores y receptores. Si se confinara el estudio a los niveles donadores uno se sentiría tentado a llegar a la conclusión de que la probabilidad de ocupación asociada con dichos niveles estaría dada por la función de equilibrio de Fermi (5.5-20), siendo e= ea. Sin embargo, esto no es del todo correcto, debido a la degeneración del espín de los niveles donadores. Existen en realidad dos estados cuánticos asociados con cada nivel de impurezas donadoras correspondientes a las dos orientaciones del espín permisibles del electrón sobre el átomo donador. No obstante, tan pronto como se ocupa uno de estos estados, se excluye la ocupación del otro, ya que los requisitos de valencia del ion donador se satisfacen con un solo electrón. Esta situación altera el problema estadístico que conduce a la función de distribución. Sea un sistema que tiene niveles de energía de este tipo, como se ilustra en la figura 9.9. Se supondrá que los electrones que ocupan los niveles son partículas

No. nivel de energía

Figura 9.9.

2

3

4

1------1 1----------11 n

Energía

.,

•z

.3

.4

.,

Degeneración

g,

9z

g3

g4



glt

No. de electrones

N,

Nz

N3

N4



N"

."

Niveles de energía y notación usada en los cál..,ulos de la sección 9.5.

296

Semiconductores electrónicos uniformes en equilibrio

indistinguibles y que existen N¡ electrones en el iésimo nivel cuya degeneración es g¡. El número de formas de insertar el primer electrón en los estados cuánticos pertene-cientes al iésimo nivel, es g¡; el número de maneras de colocar el segundo es g¡- ~ dado que la ocupación del primer estado por el primer electrón excluye la ocupación del estado de espín opuesto; el número de maneras de insertar el tercero es g¡- 4 y así sucesivamente. Para el iésimo, el número será g¡- 2N¡ + 2. El número total de modos de arreglar N¡ electrones no distinguibles en g¡ estados, en estas circunstancias, es g¡(g¡- 2)(g¡- 4) ··· (g¡- 2N¡

+ 2)

N¡!

(9.5-1)

El factor N¡! del denominador se incluye porque las distribuciones que son idénticas a excepción de la permutación de los electrones entre ellas mismas no deben contarse como distribuciones diferentes, ya que los electrones no son distinguibles unos de otros. El número total de formas de lograr una distribución en la que se tengan N 1 , N 2 • • • N n electrones en los niveles 1, 2, • • • n, es el producto de los factores de la forma (9.5-1) sobre los niveles del sistema. Esta es precisamente la cantidad Q(N1 N 2 • • • Nn) del capítulo 5 [véase, por ejemplo, (5.5-3)]. Por tanto. para este sistema se tiene (9.5-21

La función de distribución resultante se determina maximizando In Qa como antes, utilizando el método de los multiplicadores lagrangeanos que se desarrolló en el capítulo 5, siendo el resultado

en donde Et es la energía de Fermi definida del modo acostumbrado. Para los niveles donadores, el número de átomos donadores es la mitad de la cantidad de estados de espín o sea, 1/2g¡, de tal manera que para este sistema se puede escribir n d -

N-

d

1 + te(~d

E¡)/kT

(9.5-4)

en donde Na es la concentración de átomos donadores de impurezas, Ea es la energía de los niveles donadores y na es el número de electrones por unidad de volumen que ocupan los niveles donadores (es decir, la concentración de donadores no ionizados). Evidentemente, la función de Fermi está modificada por la presencia del factor 1/2 que va en el denominador antes del término exponencial. De manera similar, se puede demostrar que si Na es la concentración de átomos de impureza receptores y Ea la energía de los niveles receptores, la concentración de huecos asociada con Jos átomos receptores (o sea, la densidad de los sitios receptores no ionizados) Pa, será Pa

= } + te<•!

Ea)/kT •

(9.5-5)

Estadística de los semiconductores con impurezas

297

La densidad de estados asociada con los niveles donadores y receptores se puede representar en términos de las funciones 8- de Dirac por medio de (9.5-6) y

(9.5-7) Estas ecuaciones significan que no existen niveles donadores o receptores a energías que no sean ea y ea, y que la cantidad total de estados cuántico donadores y receptores por unidad de volumen es 2Na y 2Na, respectivamente. Si la aproximación de Boltzmann es válida, tanto para la banda de conducción como para los niveles donadores (es decir, si el nivel de Fermi está a varias unidades kT por debajo de ea), el factor exponencial del denominador de la expresión en (9.5-4) es mucho mayor que la unidad, y por ende, puede hacerse caso omiso de este último; en donde, la ecuación (9.5-4) se puede escribir como (9.5-8) Puesto que la concentración de electrones en la banda de conducción está dada por (9.3-6), se puede escribir la relación de na, el número de electrones asociado con los donadores no ionizados, y n 0 + na, que es el número total de electrones libres y débilmente enlazados como sigue (9.5-9)

Ahora, ec - ea es la energía de ionización de los donadores que por lo general es del orden de kT o un poco más pequeña; de donde, el factor exponencial anterior es del orden de la unidad. Si Nv ~-!-Uc, la relación entre el número de electrones en donadores no ionizados y el número total será muy pequeña. Puesto que a 300°K Ue es del orden de 10 19 cm- 3 , esta condición se satisface a esa temperatura para todas las concentraciones de impurezas donadoras que son reducidas en comparación con esta cifra. En estos casos, es evidente que los donadores están casi totalmente ionizados y por lo general es más conveniente y exacto proceder sobre la suposición de que su ionización es completa, haciendo que na sea igual a cero. A temperaturas muy bajas, el factor exponencial de (9.5-9) puede ser apreciablemente más pequeño que la unidad y el criterio para la ionización completa de los donadores se debe escribir en la forma más general (9.5-10) De modo similar, a condición de que la aproximación de Boltzmann para los huecos sea válida tanto para la banda de valencia como para los niveles receptores, se puede demostrar que estos últimos quedan prácticamente ionizados por completo siempre que (9.5-11) A menos que la temperatura sea muy baja, esto equivale al requisito Na ~tUv. En casi todas las circunstancias el nivel de Fermi quedará dentro de la banda prohibida, a muchas unidades kT lejos tanto de los niveles receptores, como de los

298

Semiconductores electrónicos uniformes en equilibrio

donadores, y las impurezas receptoras y donadoras que puedan estar presentes estarán ionizadas casi por completo. En un semiconductor en equilibrio debe haber un hueco térmico o un ion donador positivamente cargado por cada electrón libre, y un electrón térmico o un ion receptor negativamente cargado por cada hueco libre. Por tanto, todo el cristal debe ser eléctricamente neutro. Esta condición de neutralidad eléctrica se puede expresar igualando a cero la suma algebraica de todas las cargas negativas y positivas. por lo cual (recordando que la concentración de los donadores ionizados es Na- na y la de los receptores ionizados es Na - Pa), (9.5-12) Para todas las temperaturas, excepto las más bajas, y también para los valores más elevados de concentración de impurezas, la aproximación de Boltzmann será valida para las bandas de conducción y valencia, y también para los niveles donadores y receptores, de donde, las concentraciones de donadores y receptores no ionizados, Pa y na, se pueden omitir en (9.5-12), lo cual da (9.5-13) o bien, si se emplea (9.3-6) y (9.3-15), (9.5-14) Si se hace que IX

= e•¡/kT,

Pe =

e -•clkT

y

(9.5-15)

entonces, (9.5-14) se puede escribir en la forma (9.5-16) Al resolver esta ecuación cuadrática para o: y tomar el logaritmo del resultado, se obtiene (9.5-17) Se debe escoger el signo positivo del radical de (9.5-17), ya que cuando Na= Na =O, ee¡fkT debe ser una cantidad positiva. Esto se puede expresar de un modo más satisfactorio haciendo notar que (9.5-18) Al utilizar esta relación y substiuir los valores dados por (9.5-15) para f3v y f3c. (9.5-17) se puede expresar como sigue (9.5-19)

Estadística de los semiconductores con impurezas

299

Como se puede ver de (9.3-23), los dos primeros términos del lado derecho de esta ecuación representan el nivel de Fermi E¡¡ para un semiconductor intrínseco y, ya que de acuerdo con (9.3-17) y (9.3-20), n¡=..JUcUve-i::.ef 2 kT, (9.5-19) se puede escribir fmalmente como

e1 = e1 ¡ + kT se nh

-l(Nd-2n¡Na) .

(9.5-20)

~.----------------

~---------------

~-----------------

~"----------------

., ----------

.. ---------

t'f - - - - - - - - - -

~-------------

(a) (tipo·nl Figura 9.10.

(b)

(tipo-p)

Posiciones relativas de los bordes de banda, nivel intrínseco de Fermi y nivel real de Fermi en (a) semiconductores tipo n y (b) tipo p.

Esta expresión da el nivel de Fermi para un semiconductor con impurezas dentro del rango en el que se satisface la aproximación de Boltzmann y los donadores y receptores se pueden considerar como totalmente ionizados. Las cantidades n 0 ,p 0 ,nd y Pa se pueden obtener fácilmente a partir de (9.3-6), (9.3-15), (9.5-4) y (9.5-5) una vez que se ha determinado el nivel de Fermi. Puesto que senh-lx es positivo para x >O y negativo para x E¡¡ para semiconductores tipo n (Nd - Na > O) y E¡< E¡¡ para semiconductores tipo p (Nd -Na< 0), como se ilustra en la figura 9.10. Si la cantidad de donadores y receptores es idéntica, la función senoidal hiperbólica inversa desaparece y el material se comporta exactamente como un semiconductor intrínseco en lo que respecta a las poblaciones de electrones y huecos. En estas condiciones, se dice que las impurezas tipo n y p están plenamente compensadas. Si la densidad neta de impurezas INd- Nai es mucho mayor que n¡, el número de portadores térmicamente excitados será pequeño en comparación con la cantidad total; en este caso, el argumento de la función senoidal hiperbólica inversa de (9.5-20) es muy grande. Puesto que senh- 1x ~±In 12xl para valores grandes de x, es obvio que en estas circunstancias (9.5-20) se convierte en (9.5-21) en donde el signo más se usa para el material tipo n (Nd >Na), y el signo menos para el tipo p (Na> Nd). Se dice que un material semiconductor de esta naturaleza es un semiconductor fuertemente extrínseco y el rango de aplicabilidad de (9.5-21) se cita a menudo como el rango extrínseco. Por supuesto, la densidad de portadores en las bandas de conducción y valencia se puede encontrar substituyendo la expresión (9.5-17) en lugar del nivel de Fermi en (9.3-6) y (9.3-15). Se pueden determinar estas cantidades también en la condición de neutralidad eléctrica (9.5-13), con la ayuda de (9.3-20). Por ejemplo, cuando se substituye Po= nl/n 0 en (9.5-13), se obtiene (9.5-22)

300

Semiconductores electrónicos uniformes en equilibrio

que se puede resolver para n 0 , dando (9.5-23) Para resolver la ecuación' cuadrática, es necesario seleccionar el signo positivo para el radical, ya que el resultado debe reducirse a + n¡ para Nd =Na =O. Del mismo modo, cuando se substituye n0 = n[ jp 0 en la ecuación de neutralidad de carga, se puede demostrar que (9.5-24) De acuerdo con estas fórmulas, es evidente que cuando Nd- Na= O, no=Po =n¡. Este es el caso de la compensación total (o, si Nd =Na= O, de un semi· conductor intrínseco). Si N d - Na >O, n 0 >Po como es de esperarse en un se· miconductor de impurezas tipo n; si Nd -Na< O, Po > n 0 como se requiere en el caso de un semiconductor tipo p. Para materiales fuertemente extrínsecos, estas fórmulas se simplifican mucho. Por ejemplo, si Nd -Na;;» n¡, como sucede para una muestra de un fuerte tipo n, entonces, (9.5-25)

y

en tanto que para un material fuertemente p, en donde Nd -Na es grande y negativo, y

n~

no~ N ~N. a

(9.5-26)

d

Con el fin de conservar una generalidad total, se ha supuesto desde el principio que están presentes tanto impurezas donadoras como receptoras. No obstante, en muchos casos, sobre todo los relacionados con cristales en los que se han incorporado intencionalmente impurezas de un tipo, la concentración del otro tipo de impurezas puede desecharse por completo y, en efecto, igualarse a cero, en todas las fórmulas de esta sección.

9.6

EL CASO DE LA IONIZACION INCOMPLETA DE NIVELES DE IMPUREZA (TEMPERATURA MUY BAJA)

Es posible que a temperaturas muy bajas no exista la suficiente energía térmica disponible para conservar la ionización completa de los niveles de impurezas donadoras y receptores como lo determinan los criterios (9.5-10) y (9.5-11). Por ejemplo, a la temperatura del cero absoluto, en un semiconductor tipo n, los niveles donadores deben estar totalmente ocupados y la banda de conducción vacía por completo de electrones. Estas dos condiciones no se pueden alcanzar a menos que el nivel de Fermi quede entre los niveles donadores y la banda de conducción, como se rl~scribe en la figura 9.11. En este .caso, la aproximación de Boltzmann ya no se puede usar para describir la probabilidad de aplicación asociada con los niveles donadores, ya que el nivel de Fermi se encuentra ahora más bien arriba que debajo de los niveles de energía donadores. Sin embargo, la aproximación de Boltzmann se puede seguir aplicando a los electrones de la banda de conducción debido a que el nivel de Fermi

El caso de la ionización incompleta de niveles de impureza

301

.t •• -r-----==.t

.,

•• f 0 =O

Figura 9.11.

1/2

Función de distribución en un semiconductor tipo n a temperatura muy baja.

pennanece a muchas unidades kT debajo de la base de la banda de conducción; en relación a esto se debe recordar que kT es sólo aproximadamente 0.001 eV a 10°K. Se analizará en detalle el caso de un semiconductor de tipo puramente n en donde Na= O, y se supondrá que T es tan baja que puede eliminarse la concentración de huecos creados térmicamente. Por supuesto, ya que Na =O, Pa debe desvanecerse también. Si se hace que Na = Pa =Po = O en (9.5-12), se puede escribir

(9.6-1) Si se usa (9.3-6) y (9.5-4) para expresar n 0 y nd en esta ecuación, se obtiene

(9.6-2) Sin embargo, puesto que 1-

1+

1

te.<••

.,¡¡kT-

1 -:-1-+---=2-e--;:<•:-·-.:-,"Jtk..,.T'

(9.6-3)

(9.6-2) se puede convertir en

(9.6-4) Si se hace que y

(9.6-5)

(9.6-4) se convierte en

(9.6-6)

302

Semiconductores electrónicos uniformes en equilibrio Esta ecuación se puede resolver para a de tal modo que dé

(9.6-7) Se debe escoger el signo más para que a= e"tfkT sea positiva y, por ende, e1 sea real. Ahora, por definición,

(9.6-8)

--

Al tomar el logaritmo de ambos lados de (9.6-7), usando (9.6-8) y volviendo a la notación original con (9.6-5), se puede obtener finalmente

e = -1 (e f

2

e

+ e ) + -kT In _Nd d

2

2Ue

kT senh _ 1

(J

Ue _

8Nd

e _li•
'

(9.6-9)

en donde !::.e¡ = Ec - ed es la energía de ionización de los donadores. La densidad de los electrones libres en la banda de conducción se puede calcular a partir de (9.3-6). En el cero absoluto, (9.6-9) da e1 = t(ec + ed), lo que significa que el nivel de Fermi está a la mitad entre los niveles donadores y la banda de conducción. Al aumentar la temperatura, el nivel de Fermi aumenta ligeramente (no obstante, permaneciendo por debajo de Ec) y luego decrece desplazándose hacia abajo por los niveles donadores hacia el centro de la banda prohibida. Para temperaturas en que el nivel de Fermi esté a varias unidades kT por debajo de la energía de los donadores ed, punto en el que los donadores están casi completamente ionizados, la ecuación (9.6-9) se reduce aproximadamente a (9.5-21). La prueba de este enunciado se asigna como ejercicio al lector. Se puede demostrar de manera similar, que para un semiconductor tipo p en estas mismas circunstancias, el nivel de Fermi a la temperatura cero queda hacia la mitad entre los niveles receptores y la banda de valencia y que, al aumentar la temperatura, se mueve primero un poco hacia abajo y luego ascendentemente acercándose al valor dado por (9.5-21) conforme los niveles receptores se ionizan por completo. En semiconductores tipo n y tipo p, el nivel de Fermi tiende al valor intrínseco e¡¡ como lo establece (9.3-23) a temperaturas lo suficientemente altas, ya que a una temperatura elevada, el número n¡ de portadores térmicamente excitados tendrán un exceso notable en relación con el número INd- Nal con el que contribuyen las impurezas donadoras y receptoras. Al exceder este punto, el comportamiento del material será muy aproximado en todos los aspectos al de un semiconductor intrínseco. No obstante, en algunos casos esta temperatura de transición puede exceder el punto de fusión del semiconductor. El nivel de Fermi, como lo determinan (9.6-9) en el rango de temperaturas bajas y (9.5-20) a temperaturas elevadas, se ilustra como una función de temperatura para materiales tipo n y tipo p en la figura 9 .12.

9.7

CONDUCTIVIDAD

La densidad de corriente debida a huecos y electrones es igual al producto de su densidad de carga y velocidades respectivas. Por tanto, la densidad de corriente o

Conductividad

i.,

i.,

(T)

303

(T)

-r

~r-------------------------

-r

•• o (o) tipo-n Figura 9.12.

(b)

tipo-p

Variación de la energía de Fermi en función de la temperatura para semiconductores (a) tipo n y (b) tipo p, de varias densidades de impurezas. Las curvas marcadas con "1" corresponde!• a densidades de impurezas relativamente bajas, las marcadas con "2" a densidades intermedias, y las marcadas con "3" a densidades de impurezas relativamente altas.

la densidad de carga por unidad de tiempo transportada por huecos y electrones es

(9.7-1) y

(9.7-2) en donde Pn y Pp se refieren a las densidades de carga asociadas con las densidades de electrones y huecos n y p, y Vn y vP son las velocidades vectoriales promedio de los electrones y los huecos, respectivamente. Puesto que la velocidad electrónica promedio es - J.LnE y la velocidad promedio de los huecos es J.LpE, en donde J.Ln y J.Lp son las movilidades del electrón y el hueco y E es el campo, {9.7-1) y {9.7-2) se puede escribir como sigue

(9.7-3)

(9.7-4) por lo cual, la densidad total de corriente eléctrica 1 se puede expresar como 1 = e{nJ.Ln

+ PJ.Lp)E =

aE.

(9.7-5)

La conductividad eléctrica a está dada entonces por

(9.7-6)

304

Semiconductores electrónicos uniformes en equilibrio Las movilidades P.n y P.p de las fórmulas anteriores se definen como y

(9.7-7)

en donde 1'n y Tp son los promedios ponderados de los tiempos de relajación 7 n para electrones y 7 P para huecos sobre la distribución Maxwell-Boltzmann calculadas como lo establece la ecuación (7 .3-12). También se debe observar que n y p son los valores instantáneos reales de la concentración de huecos y electrones que no necesariamente son idénticos a las densidades de equilibrio de huecos y electrones n 0 y Po. Sin embargo, hasta ahora se ha supuesto que no existen gradientes de densidad de portadores (que originarían corrientes de difusión). Por supuesto, si las densidades de portadores son las relacionadas con el estado de equilibrio, se descubrirá que (9.7-8) es el valor correspondiente de conductividad. Es necesario establecer esta distinción. porque es posible crear densidades de portadores en exceso de los valores de equilibrio en los semiconductores, como se verá más tarde. Para un semiconductor intrínseco con densidades de portadores iguales a los valores de equilibrio, n 0 = p 0 = n¡ y (9.7-8) se convierte en (9.7-9) en donde b se define como la relación entre la movilidad de los electrones y los huecos, es decir,

b

= /ln/ /lp·

(9.7-10)

Si se usa (9.3-21), (9.7-9) se puede escribir en la siguiente forma (9.7-11) Puesto que la movilidad P.p tiene casi siempre una dependencia de la tempera· tura que anula en su mayor parte la variación de temperatura '['3/ 2 del término que precede al factor exponencial y, puesto que b no depende mayormente de la temperatura, la variación anterior de a0 como una función de 1/T es esencialmente exponencial. De donde, una gráfica semilogarítmica de a 0 en función de 1/T da una línea recta con una pendiente fle/2k, y el valor de la banda prohibida !le puede determinarse con mucha precisión valorando la pendiente de una gráfica experimentalmente medida de ln a 0 en función de 1/T en el rango intrínseco. Para un semiconductor que no es necesariamente intrínseco, sino que tiene densidades de huecos y electrones que corresponden a los valores de tquilibrio n 0 ,p 0 , la conductividad está dada por (9.7-8). Usando (9.7-10) para ebninar P.n, y luego substituyendo las expresiones (9.5-23) y (9.5-24) para n 0 y p 0 , la conductividad se puede escribir como

CTo = e¡lp (bno +Po)= e/lp

[~ (b- l)(N

4 -

Na)+ (b

+ l)J~(N4 - N

0)

2

+ n/

J.

(9.7-12)

Conducdwdad 305 Temperatura en °K

Temperatura en °K 33 3

1000300 78

20 4

10

14.3

10

333

18300 78

204

14 3

10

6 4

2

o

u

:e •:::1 u

o

~

E

-...

u

'



.e

eQ)

E

~

u

. , e

o a.

11 'C

"'E' "'u

·;:::

Q)

"'::J 'C

"C

u

"C

"' E

e o

o

~

~

0001~----~----~----~----~----~

o

00
(a)

0.04

006

0.08

Temperatura en °K

11

002

0.10

0.04

0.06

008

t 1 Temperatura en °K

(b)

.... u

1

> ;:;... E

u

eQ) "C

"' 10 4 ~---------------------------+~~~~~~ ~ ·:; o :¡¡;;

61

58 Nd ~ 10 11 cm-z I0 3 ~~~~~~A---~~~~~------~--__J 10 20 30 40 50 60 80 100 200 300

(e) Figura 9.13.

Temperatura en

°K

(a) Conductividad eléctrica, (b) concentración de portadores y (e) movilidad de electrones para una serie de muestras de germanio tipo n que cubren una amplia variación de contenido de impurezas donadoras. [De acuerdo con E. M. Conwell, Proc. I.R.E., 40: 1327 (1952).]

01

306

Semiconductores electrónicos uniformes en equilibrio

Véase ahora un semiconductor tipo n para el que Nd- Na es positivo. A temperaturas bajas, n¡ ~Nd- Na, por lo que, de acuerdo con (9.7,12), a 0 ~ (NdNa)beJlp = (Nd- Na)eJln, que es independiente de la temperatura, excepto en lo que Jln pueda depender de T. Por tanto, el semiconductor es un material fuertemente extrínseco y la mayoría de sus portadores se originan en los átomos de impurezas. Al aumentar la temperatura, n¡ aumenta con gran rapidez, de acuerdo con (9.3-21), después llegará un momento en que será igual y luego sobrepasará a NdNa. Para temperaturas tales que n¡';PNd -Na, (9.7-12) da a 0 ~eJlpn¡(b + 1), que es el mislno valor dado por (9.7-9) para un semiconductor intrínseco. Entonces la conductividad aumenta con gran rapidez al incrementarse la temperatura debido al rápido aumento de n¡. La muestra es ahora básicamente un semiconductor intrínseco. La transición entre estos dos extremos de comportamiento se produce a la temperatura en que n¡ = Nd- Na. Al aumentar la densidad de impureza Nd- Na, esta temperatura de transición aumenta y para diferentes substancias semiconductoras con la misma densidad de impurezas, la temperatura de transición aumenta al incrementarse la banda prohibida /),¡¿ ya que la temperatura necesaria para generar una densidad dada de portadores intrínsecos aumenta con /),¡¿_ Se puede demostrar que se sigue el mismo comportamiento cualitativo de (9.7-12) en los materiales tipo p, en cuyo caso Nd- Na es negativo. En la figura 9.13 se ilustra una gráfica semilogarítmica de la conductividad en función de 1/T como lo predice (9.7-12) para·varias muestras con diferentes contenidos de impurezas. A temperaturas extremadamente bajas (menos de aproximadamente 30°K), no existe la suficiente energía térmica disponible para mantener la ionización de los niveles donadores y receptores. En este rango de temperatura, la conductividad desciende de nuevo con rapidez al reducirse la temperatura, conforme los electrones libres y los huecos se "congelan" de las bandas de conducción y valencia hacia los niveles donadores y receptores. En cristales con una densidad de impureza muy elevada, las funciones de onda de los electrones de átomos donadores cercanos o huecos de átomos receptores cercanos pueden superponerse apreciablemente. El resultado de esto es la ampliación del nivel donador o receptor a una banda angosta de energía, al igual que los niveles atómicos de energía se ensanchan para formar una banda en la aproximación de enlace filme, conforme las funciones de onda electrónicas de átomos vecinos comienzan a superponerse. Puesto que existe el doble de estados en estas bandas que electrones (o huecos), se puede observar una pequeña conductividad residual de la banda de impllrezas en la banda de impurezas parcialmente llena en la región de temperaturas extremadamente bajas, en donde los electrones y los huecos se "congelan" de las bandas de conducción y valencia hacia los niveles donadores y receptores.

9.8

EL EFECTO DE HALL Y LA MAGNETORRESISTENCIA

En la seccwn 7.6 se estudió el efecto de Hall en los gases de electrones libres para el caso en que los electrones y los huecos tienen la misma componente de velocidad x. Este análisis conduce a la expresión (9.8-1) para el campo transversal de Hall, en donde ! 0 es la densidad de corriente, B 0 la inducción magnética y R la constante de proporcionalidad denominada coeficiente de Hall. En la figura 7.3 se ilustra la orientación de la muestra, la corriente y los

El efecto de Hall y la magnetorresistencia

307

campos. En el caso sencillo que se vio en la sección 7 .6, en donde se supuso que los portadores de carga eran electrones, se obtuvo la expresión

1

R=-n0ec

(electrones)

(9.8-2)

para el coeficiente de Hall. De acuerdo con el análisis de la secc10n 7.6, se ve claramente que si los portadores de carga son huecos positivos, cuya concentración es p 0 , la expresión para el coeficiente de Hall sería

1 R=Poec

(huecos).

(9.8-3)

Y a se señaló que el efecto de la distribución de velocidades se despreció al obtener estos resultados. Ahora se incluirá el efecto de la distribución de velocidad para volver a determinar el coeficiente de Hall de un semiconductor. Además, hay que tener en cuenta que en un semiconductor pueden estar presentes simultáneamente portadores de carga positivos y negativos. Además de estos efectos que tienen un interés inmediato para este estudio, existen otras dos complicaciones que se deberán resolver eventualmente. Hasta ahora, en todos los cálculos de población de portadores y transporte que se han llevado a .:abo, siempre se ha supuesto que las superficies de energía constante dentro del espacio de la cantidad de movimiento o espacio k, eran esféricas. Esta suposición se 0rigina naturalmente cuando el valor mínimo de energía en la zona reducida de Brillouin ocurre en el punto central k = O. Sin embargo, existen substancias, incluyendo al germanio y al silicio (sólo en las bandas de conducción), en las que el mínimo de energía se produce, no en el origen, sino en un grupo de puntos cristalográficamente equivalentes en otras partes de la zona de Brillouin. En tales casos, las superficies de energía constante en las cercanías de los mínimos de energía pueden ser elipsoidales más bien que esféricas. Esto introduce una anisotropía en la masa ~fectiva asociada con cada elipsoide; aunque los portadores se comportan como partículas libres en el sentido de que la variación de e con k es parabólica en cualquier dirección de movimiento, tienen una masa efectiva diferente a lo largo de cada una de estas direcciones. A pesar de que la anisotropía en las propiedades de transporte se pierde cuando se suman los elipsoides de energía asociados con todos los puntos mínimos de energía, el procedimiento para computar los factores de densidad de ~stados y promediar las propiedades de transporte sobre las velocidades, se debe modificar para tener en consideración esa configuración diferente de las superficies de energía constante. Además de esto, las bandas de valencia del germanio y el silicio se componen realmente de dos bandas distintas superpuestas en donde cada una de éstas se asocia .:on una masa efectiva distinta. Aunque las superficies de energía constante para estas dos bandas son aproximadamente esféricas cerca del punto máximo en k = O, existen en realidad dos especies de huecos presentes (huecos "ligeros" y huecos ··pesados" correspondientes a las dos masas efectivas) en forma simultánea. Cualquier teoría de procesos de transporte que intente explicar a fondo los abundantes datos experimentales que existen en este campo en relación con el germanio y el silicio, debe necesariamente tener en cuenta estas dos complicaciones adicionales. Sin embargo, para principiar será suficiente ampliar el cuadro del efecto de Hall y los fenómenos relacionados con el mismo, para cubrir de un modo simultáneo a huecos y electrones e incluir el efecto de la distribución de velocidades. Por tanto, se seguirá suponiendo que se maneja un semiconductor simple con superficies -ie energía esféricas tanto en la banda de conducción como en la de valencia y que

308 Semiconductores electrónicos uniformes en equilibrio sólo se tiene una variedad de electrones y huecos. Más tarde se indicará cómo estos resultados se puede ampliar para admitir las dos dificultades adicionales que se acaban de mencionar. En primer lugar se considerará un solo tipo de portador (se escogió a los huecos) y se incorporará el efecto de la distribución de velocidad. La forma más evidente para proceder es a partir de la ecuación de Boltzmann con el término de la fuerza de Lorentz (7.6-2). No obstante, es más sencillo y provechoso utilizar otro método 3 que principia con la ecuación de movimiento para un hueco en presencia de un campo eléctrico uniforme E y una inducción magnética uniforme 8 0 . Esta ecuación se puede escribir como sigue

* dv

F = mP -d = eE

t

+ -ee v X B0 •

(9.8-4)

Si se supone que la muestra, la corriente y el campo magnético están orientados como se indica en la figura 7.3, es obvio que B0 tiene sólo una componente z y (9.8-4) se reduce a dos ecuaciones para las componentes x y y de la velocidad, que tienen la forma

(9.8-5) (9.8-6) en donde

roll

= eB0 /m;c.

(9.8-7)

Este conjunto de ecuaciones se puede resolver más fácilmente multiplicando

(9.8-6) por el número imaginario i y sumando el resultado a (9.8-5). Mediante este procedimiento se obtiene una sola ecuación

dV e8 -+ iro 0V = dt m*p

(9.8-8)

en donde las cantidades complejas V y 8 se defmen mediante

V= v,.

+ iv7

8 =E,.+ iE,.

y

(9.8-9)

La ecuacton (9.8-8) se resuelve fácilmente multiplicando los dos lados por &wot. El lado izquierdo se puede expresar como la derivada en el tiempo de Veiwot, y la ecuación resultante se integra con respecto al tiempo para dar 1

1

e8

.

V t> too = - - e•toor + C

. 0mP* 1ro

(9.8-10)

3 Véase, por ejemplo, H. Brooks, Advances in Electronics and Electron Physics, Nueva York: Academic Press, Inc. (1955), Vol. VII, página 127 ff.

El efecto de Hall y la magnetorresistencia

309

en donde e es una constante de integración. Si se hace que V0 = Vxo + ivyo sea el valor de V en t = O, se puede evaluat en términos de V0 a partir de esta ecuación, lo cual permite escribir {9.8-10) como

e

= V.oe-imot + ~* {l _

V

o

1w0

e-iwot)

m,

(9.8-11)

o

Esta expres10n se debe promediar primero sobre la distribución exponencial de tiempos de relajación, lo cual da, en analogía con (7.2-13).

f'x' V(t)e- 11'' dt

(V) Prom.

sobre t

_Jo -

oo

fo e-1/•, dt

_

-

1 •

1 + IC.Oot,

[V.o+ e~t,] * , m,

(9.8-12)

en donde 7 P representa el tiempo de relajación para huecos. A continuación se deberá promediar esta expresión sobre la distribución Maxwell-Boltzmann de velocidades. Como siempre, se supondrá que 7 P es una función de la magnitud v; pero es independiente de la dirección, es decir, isotrópica, de donde los promedios asociados con el primer término de (9.8-12) siempre darán un promedio de una función sólo de la magnitud de v por una componente Vxo ( = v0 sen cos cf>) o Vyo ( = v0 sen e sen cf>). Un promedio de esta naturaleza será siempre cero ya que la integral de la expresión resultante sobre la coordenada azimutal cf> siempre se desvanece. Por tanto, en este estudio se puede omitir por completo de este término. Si se separa el segundo término anterior en sus partes real e imaginaria, la parte real se puede identificar como Vx y la imaginaria como vy, de acuerdo con (9.8-9). De donde, se obtiene

e

(9.8-13) y ésta es la expresión que se debe promediar sobre la distribución de Boltzmann para obtener los valores promedios de Vx y Vy. En la sección 7.3 se vio, utilizando la ecuación de Boltzmann, que si .a:(v) es la cantidad que se va a promediar, el promedio correcto que se debe sacar es (9.8-14) Si no se tiene un campo magnético, entonces, en la expresión (9.8-13), w 0 =O y la ecuación da simplemente las velocidades vx y vy en función de los campos eléctricos Ex y Ey. En este límite, la ecuación debe concordar con (7.3-11) y, en efecto, lo hace, a condición de que 7 P se promedie de acuerdo con lo establecido en {9.8-14). En realidad, como caso general, todos los promedios se deben calcular de esta manera, lo cual conduce a (9.8-15)

310

Semiconductores electrónicos uniformes en equilibrio

en donde (9.8-16) y -

v,

-

e

= lm(V) = ---;¡; [ ( 1 mP

-r:P

-r:P

2 2)

+ w 0 -r:P

E-, - Wo ( 1 2 2 2 ) Ex ] . + w 0 -r:P

(9.8-17)

Las componentes x y y de la densidad de corriente, en la forma acostumbrada pueden expresarse como y

(9.8-18)

Como se ilustra en la figura 7.3, en t>l arreglo experimental acostumbrado, la componente y de la corriente es cero, de donde, de acuerdo con (9.8-17), (9.8-19)

Al substituir esto en (9.8-16), se obtiene finalmente

(9.8-20)

Si rp es independiente de v, entonces f(rp) =f(rp) y las ecuaciones anteriores se reducen a los resultados simples e intuitivos (9.8-21)

(9.8-22)

que concuerdan con (7.3-14) al igual que con (9.8-1) y (9.8-3). Es obvio que la simple expresión del coeficiente de Hall obtenida anteriormente, es correcta aun cuando exista una distribución de velocidades de Boltzmann, a condición de que T sea independiente de la velocidad. También es evidente en (9.8-21), que en este caso la conductividad eléctrica es independiente del campo magnético, es decir, no existe una magnetorresistencia. Sin embargo, generalmente T P depende de la velocidad y, entonces estos resultados ya no son correctos. En tales circunstancias, es más conveniente establecer la suposición de simplificación que consiste en que w 0 T P ~ l. Esta condición se satisTará mejor para valores pequeños de inducción magnética y valores también pequeños de T P que casi siempre se asocian con temperaturas más altas. La condición se satisface normalmente en la mayoría de las substancias en las condiciones experimentales comunes hasta el rango de la temperatura del nitrógeno líquido, aunque también es muy posible violarla, si esto es lo que se desea. Por ejemplo, si B 0 = 10,000 oersteds, T ,, =- JO- 12 seg. (correspondiente a una movilidad del orden de

El efecto de Hall y la magnetorresistencia

311

2000) y m;= m 0 , entonces, WoTp::::: 0.2. En este caso, el requisito quedaría marginalmente satisfecho; pero campos más altos y tiempos de relajación mayores darían como resultado su violación. Si se supone que la condición es aplicable, se puede hacer caso omiso de la cantidad w~T~ en (9.8-20) en comparación con la unidad. De donde [expresando w 0 media..tlte (9.8-'i')j, ~::sta expresión se puede escribir como sigue

(9.8-23)

en donde a 0 = p 0 e 2 rp/m;. Ahora parece que la conductividad eléctrica depende del campo magnético; a este efecto se le conoce como magneto"esistencia. Se puede demostrar que el segundo término entre paréntesis angulares de la expresión anterior es siempre positivo, de tal modo que la conductividad se reduce invariablemente por acción del campo magnético. La ecuación (9.8-23) se escribe con mayor frecuencia de un modo diferente; resolviendo para Ex en función de lx y observando que tl - w~r~)- 1 ::::: 1 + w~r~ para w 0 r P ~ 1, se puede obtener

(9.8-24)

en donde Po = 1/a0 es la resistividad de campo cero. El coeficiente de magneto"esistencia se define entonces como

(9.8-25)

De acuerdo con (9.8-24), es evidente que la magnetorresistencia longitudinal de campo pequeño predicha por estas ecuaciones, es proporcional al cuadrado de la inducción magnética B 0 • Desde el punto de vista físico, el efecto de la magnetorresistencia se debe al hecho de que el campo magnético desvía las partículas de un modo ascendente o descendente a lo largo del eje y, en una dirección normal a la dirección del vector de corriente. Las trayectorias resultantes son más bien curvas que rectas y la distancia promedio de arrastre a lo largo de la dirección del flujo de la corriente entre colisiones, por ende, se reduce. Si se emplea la misma aproximación en (9.8-19), el campo de Hall Ey se convierte en (9.8-26)

En esta ecuacwn, el campo Ex se puede expresar con exactitud aceptable como lx/a0 , y el término magnetorresistente de (9.8-24) es pequeño en comparación con el término de campo cero para w 0 r P ~ l. Al substituir este valor junto con las expresiones para a 0 y w 0 en (9.8-26), se obtiene

E,= RB0 lx

(9.8-27)

312 Semiconductores electrónicos uniformes en equilibrio en donde [recordando (9.8-14)] el coeficiente de Hall R está dado por 1 t2 1 (v 2 )(v2 t 2 ) R=----P-=-P 2 Poec (ip) p 0 ec (v 2 tp) 2



(9.8-28)

El coeficiente de Hall lo modifica el factor (~)/(7p) 2 en relación con el valor dado por la teoría del capítulo 7. También es evidente que el valor dado por (9.8-27) es un valor de campo pequeño que sólo es bueno en tanto que w 0 r P = ('A.~) = A.~; también, de acuerdo con (7 .3-12) y (7 .3-18), se observa que (v 2 ) = 3kTfm y (v-zr p> = A.p = A.pC, en donde e esta dada por (5.4-20). Si se substituyen estos valores en (9.8-28), se obtiene r~/(7p) 2 = 3rr/8, y el coeficiente de Hall se convierte en 3n 1 R=-8 p0 ec 3n

1 8 n0 ec

=----

(tipo-p)

(tipo-n ).

(9.8-29)

El coeficiente de magnetorresistencia no se puede expresar en forma tan simple, porque diverge la integral requerida para evaluar T~ y es necesario un planteamiento más exacto. Esta divergencia se puede evitar señalando que para la dispersión de red, r se hace muy grande a velocidades bajas, en tanto que para la dispersión por impurezas sucede exactamente lo contrario. Entonces, lo que sucede es que por debajo de cierta velocidad, la dispersión de impurezas y no la de red es la que se convierte en el factor dominante y para estas velocidades (a las que se encuentra la divergencia), los promedios se deben calcular basándose en la relación tiempo de relajación, en función de la velocidad asociada, con la dispersión de impurezas en lugar de la que se asocia con la dispersión de red. Por tanto, se podría esperar que la magnetorresistencia se vea afectada enormemente por pequeñas contribuciones de la dispersión de impurezas. En efecto, este es el caso. También puede esperarse que, sobre estas bases, el análisis que da el coeficiente de Hall suponiendo solamente la dispersión de red, sea inválido en la región en donde r P está limitado por la dispersión de impurezas como en realidad sucede. En este caso no existe una divergencia

El efecto de Hall y la magnetorresistencio

313

en los promedios relacionados con este rango de velocidad. A menos que la densidad de impurezas sea alta o la temperatura muy baja, la fracción de portadores dentro del rango de velocidades bajas es muy pequeña y el resultado (9.8-29) no se afectará mucho. Ahora se verá un cristal semiconductor que no es fuertemente extrínseco, pero que contiene electrones libres y huecos en concentraciones importantes. En este caso, los huecos y los electrones, se pueden considerar por separado, utilizando exactamente los mismos métodos que se emplearon antes para derivar las ecuaciones (9.8-16) y (9.8-7). Entonces, las componentes de velocidad de los huecos y los electrones se expresan como ecuaciones que tienen la forma de (9.8-16) y (9.8-17), siendo las componentes de velocidad vpx y Vpy de los huecos idénticas a estas ecuaciones, en tanto que las componentes de velocidad de los electrones Vnx y Vny están dadas por ecuaciones en las que e se substituye por medio de -e, m; por m~, r P por r n (en donde el último símbolo se relaciona con el tiempo de relajacwn para los electrones que están dentro de la banda de conducción) y eB 0 /m;c por - eB 0 /m~c. Si también se supone que w 0 r <;¡; 1 tanto para huecos como para electrones, de tal manera que el término w~r 2 pueda desecharse en los denominadores de los promedios, las componentes de la corriente se pueden expresar como sigue

(9.8-30) y

en donde Won

eB

0 =-.m"C

y

eB0 m,c

Wop = -.-.

(9.8-32)

Si se usa (9.7-7) para eliminar las masas efectivas, y se reacomodan los términos, las ecuaciones anteriores pueden aparecer enJa forma 1" = noeJ.LnEE"- EyW0 n('r;/'rn)- E.xro:n(t!/tn)J

+ p0 e¡.t,[E.x + Eyw ,(r;¡:c")- E.xw:,(r!tt,)], 0

(9.8-33)

y

(9.8-34) Dado que el voltaje de Hall se mide en condiciones de circuito abierto, ly como antes, de donde, (9.8-34) se reduce a t2

= O,

t2

n

p

PoJ.L,Wop ::- - noJlnWon ::-

E = y

r, noJln

+ Pollp

t".

E

"

(9.8-35)

314

Semiconductores electrónicos uniformes en equilibrio

Al substituir esta expresión de nuevo en (9.8-33), después de algunas operaciones algebraicas se obtiene

en donde a0 , como siempre, está dado por (9.7-8). El término de la magnetorresistencia es ahora mucho más complejo; pero sin embargo, es pequeño en comparación con el valor de campo cero a condición de que Won T n .~ 1 y Wop T p <{ l. El campo de Hall está dado por (9.8-35) y el coeficiente de Hall de campo pequeño se puede obtener reeemplazando Ex por fx/a 0 , como se hizo antes, y en donde la diferencia entre a y a 0 según se representa mediante el término de magnetorresistencia, es despreciable en estas condiciones. Al expresar Won y w 0 p mediante (9.8-32) y eliminando las masas efectivas en favor de las movilidades y los tiempos de relajación por (9.7-7), se obtiene

(9.8-37) en donde, Esta ve que se dominante

como siempre, b = llnlllp· expresión da el coeficiente de Hall en un semiconductor no extrínseco. Se reduce a (9.8-29) cuando Po ~ n 0 o n 0 ~Po. Si el proceso de dispersión para huecos y electrones es la dispersión de fonones de modo acústico, 4 2 T'!/(7n) = ~/(7p) 2 = 3rr/8 como se demostró anteriormente y, en este caso, (9.8-37) da (9.8-38) Para un semiconductor intrínseco, Po

= n 0 = n¡

3n 1 1 - b R=---8 n¡ec 1 + b

y (9.8-38) se reduce a

(Intrínseco).

(9.8-39)

Para p 0 ~ n 0 , el coeficiente de Hall según lo da (9.8-37), es positivo y para n 0 ~ p 0 es negativo. Se requiere una inversión del signo del coeficiente de Hall para valores de p 0 y n 0 para que se desvanezca el numerador de (9.8-37). Si se satisfacen las condiciones en las que (9.8-38) es válida, esta inversión del signo del campo de Hall se produce cuando Po = b 2 n0 • Puesto que n 0 p 0 = n[, esto representa, sencillamente, Po = bn¡ o bien, n 0 = n¡/b. Si b 1, el punto de inversión no coincidirá exactamente con el punto intrínseco. Por ejemplo, para b > 1, se tendrá un rango de concentración de portadores dentro del cual el signo del coeficiente de Hall es negativo a pesar del hecho de que la muestra sea tipo p.

*

4 A pesar de que la fórmula (9.8-38) se usa con mucha frecuencia para analizar mediciones de Hall en materiales no extrínsecos, estas condiciones no siempre quedan estrictamente satisfechas, sobre todo debido a la presencia de una dispersión de fonones de modo óptico.

El efecto de Hall y la magnetorresistencia

315

Además de cualquier interés fundamental que pueda despertar, el efecto de Hall es importante debido a que permite un método práctico para saber si una muestra es tipo n o tipo p y para determinar la concentración de los portadores. Cuando se combina con mediciones de la conductividad, el efecto de Hall puede usarse también para determinar la movilidad de los portadores de carga. En muestras que son sumamente extrínsecas y en las que el mecanismo de dispersión predominante es la dispersión con fonones de modo acústico, de (9.8-29) es claro que la medición de R se puede emplear directamente para obtener n 0 o p 0 y el tipo de conductividad se obtiene del signo de R. Si hay otros mecanismos importantes de dispersión, entonces, por supuesto, para obtener una medición absoluta de la concentración de portadores, se debe conocer la cantidad ? /(7) 2 asociada con el mecanismo dominante de dispersión y, para poder evaluarla, es necesario saber la forma en que r varía como función de la velocidad. No obstante, el factor ?/(7) 2 no es mucho mayor ni mucho menor que la unidad para cualquier proceso de dispersión conocido que se produzca en la práctica, de tal modo que la medición de la concentración de portadores que sea exacta dentro de aproximadamente un factor de dos, se puede obtener siempre, cualesquiera que sean los mecanismo de dispersión y, CO!l frecuencia esto es todo lo que se requiere. La movilidad de los portadores de carga en muestras extrínsecas se obtiene eliminando la concentración de portadores entre la expresión (9.8-28) y la ecuación a 0 =PoeJlp que se deriva de (9.7-8) cuando se hace caso omiso de la concentración de los portadores minoritarios (en este ejemplo, los electrones). Para un semiconductor tipo p, el resultado es (9.8-40)

Para un semiconductor extrínseco tipo n, se puede demostrar también que (9.8-41) El producto ± cRa 0 a menudo se define como la Movilidad de Hall, de donde, ILHn = -cRao

(tipo-n)

cRa 0

(tipo-p).

ILHp =

(9.8-42)

Las ecuaciones (9.8-40) y (9.8-41) se pueden escribir, entonces como sigue llp

= ILHp((ip) 2 /~)

(9.8-43)

y

(9.8-44) Las cantidades llp y Jln son las verdaderas movilidades de arrastre o movilidades de conductividad; por otra parte, la movilidad de Hall es simplemente una cantidad con las dimensiones de la movilidad que se obtiene a partir de cantidades que son muy fáciles de medir en la práctica. Se debe conocer el factor (7)2 /r 2 para convertir la movilidad de Hall en la de arrastre real. Sin embargo, puesto que este factor rara vez se aleja mucho de la unidad, la movilidad de Hall da una indicación

316

Semiconductores electrónicos uniformes en equilibrio

aproximada de la verdadera movilidad donde el error producido en la mayoría de los casos se origina en el propio experimento. Las mediciones experimentales de la concentración de portadores y la movilidad de Hall de electrones para muestras de germanio tipo n, en función de la temperatura, se ilustra en la figura 9.11 para una gran variedad de concentraciones de impurezas donadoras. En el caso de muestras no extrínsecas, se procede más o menos en la mi~ forma. A partir de (9.8-37) o (9.8-38), se puede eliminar n 0 o Po por medio de la relación de acción de las masas n 0 p 0 = n~. La ecuación resultante que expresa a n0 1 o p 0 en función de R es de cuarto grado y no se puede resolver analíticamente de un modo sencillo, sino que se debe resolver en cada caso por métodos aproximados o numéricos. Además, existe una ambigüedad en el hecho de que se tienen dos raíces reales en lugar de una. Esto se observa en la figura 9.14, en donde el coeficiente de Hall se ha graficado en función de p 0 ; para un valor dado de R existen siempre dos valores posibles de Po. No obstante, en la práctica es bastante sencillo seleccionar cuál de las raíces es la correcta haciendo una serie de mediciones del

R

OOin;

-Po

(escala logarítmica)

Figura 9.14.

Coeficiente de Hall de un cristal semiconductor en función de la concentración de huecos.

efecto de Hall sobre una gran variedad de temperaturas. Además, para obtener las concentraciones de portadores mediante el procedimiento anterior, es necesario conocer la relación de movilidades b. Esto se puede obtener haciendo mediciones independientes de la movilidad de Hall en muestras sumamente extrínsecas tipo n y tipo p o bien, a partir de los resultados de las mediciones de arrastre de portadores en exceso que se verá más tarde. Si n 0 y p 0 se obtienen del coeficiente de Hall, y si se conoce la relación llnfllo = b, la movilidades Jln y Jlp se pueden determinar basándose en los datos de conductividad, según la expresión (9.7-8).

9.9

RESONANCIA DE CICLOTRON Y SUPERFICIES ELIPSOIDALES DE ENERGIA

Se puede hacer que los electrones y los huecos de los semiconductores exhiban una resonancia en presencia de un campo magnético fuerte y constante (que se supondrá sobre el eje z) y una pequeña radiofrecuencia osciladora transversal o

Resonancia de ciclotrón y superficies elipsoidales de energía

317

campo electromagnético de microondas cuyo vector eléctrico queda en el plano xy. Las órbitas resultantes de los huecos o los electrones son circulares en la resonancia y la energía se absorbe del campo de radiofrecuencia cada medio ciclo, como en un ciclotrón. En efecto, la situación es precisamente análoga a lo que sucede con partículas nucleares cargadas dentro de un ciclotrón y, por esta razón, el fenómeno se denomina resonancia de ciclotrón. Primeramente se investigará el caso de las superficies esféricas de energía y una sola masa efectiva escalar. La fuerza de Lorentz sobre un hueco (y se estudiarán los huecos de una muestra tipo p en este cálculo en particular), está dada por {9.8-4). Si la masa efectiva es independiente de la dirección y si se supone que el vector eléctrico del campo oscilante, cuya frecuencia es w, vibra a lo largo de la dirección x, entonces,

m;

(9.9-1) mientras que Bx = B, =O,

(9.9-2)

y las componentes de la fuerza de Lorentz dan, para las ecuaciones de movimiento,

(9.9-3)

(9.9-4)

(9.9-5) Al escribir estas ecuaciones se supuso que el vector magnético del campo de radiofrecuencias es despreciable en comparación con el campo constan te 8 0 • La ecuación de la componente z {9.9-5) se limita a indicar que la partícula se desplaza a velocidad constante sobre la dirección z; esto carece de interés especial y no será necesario hablar más al respecto. Las ecuaciones de la componente x y y se pueden escribir como sigue d 2x dy eE0 1..., -=c.o -+-e 0 2 dt dt m*

,

(9.9-6) (9.9-7)

en donde w 0 es la misma frecuencia que define (9.8-7) en conexión con el efecto de Hall. Si se suponen soluciones oscilatorias de la forma x =x 0 &wt y y =y 0 eiwt estas ecuaciones se reducen a

(9.9-8)

318 Semiconductores electrónicos uniformes en equilibrio y

(9.9-9) que se pueden resolver para las amplitudes x 0 y Yo para dar Xo =

eE0 /m; 2

Wo -

w

2

iw 0 iw 0 eE 0 / m; Xo = ( 2 w w Wo - w 2)'

Yo = -

(9.9-10)

(9.9-11)

Cuando w = w 0 = eB 0 /m;c, se produce la resonancia y las amplitudes se hacen muy grandes. La frecuencia de resonancia w 0 se denomina a menudo frecuencia de ciclotrón. Evidentemente, si w 0 se mide de un modo experimental y si la inducción magnética B 0 se conoce con precisión, se puede determinar la masa efectiva En la práctica, el efecto de la resonancia de ciclotrón constituye uno de los mejores métodos para medir las masas efectivas. De acuerdo con (9. 9-l O) y (9 .9-ll ), se observa que conforme w -+ w 0

m;.

(9.9-12) de donde,

(9.9-13) (9.9-14) Entonces, en la resonancia, x(t) y y(t) son vibraciones armomcas ortogonales con la misma amplitud y con una diferencia de fase de 90°. Se puede ver con facilidad que la trayectoria de la partícula resultante, que representa la órbita del hueco, es circular. En la práctica, la resonancia se observa normalmente midiendo el factor Q de una cavidad resonante de microonda mientras se hace variar el campo magnético B 0 (y, por ende, la frecuencia w 0 ). Cuando w 0 es igual a la frecuencia de excitación de microondas, se obtiene una disminución brusca en el valor de Q de la cavidad, ya que en la resonancia se absorbe una gran cantidad de la energía del campo electromagnético cuando los portadores se excitan a amplitudes grandes de resonancia y luego se dispersan por acción de las impurezas o por las vibraciones de red. Conviene observar que en este experimento se desea que la cantidad w 0 T sea mucho mayor que la unidad, de manera que los portadores puedan excitarse a través de varias órbitas completas antes de dispersarse. En estas condiciones son capaces de absorber una gran cantidad de energía de las microondas y cuando se produce la dispersión, transformarla en vibraciones de la red cristalina. Por lo general, el experimento se lleva a cabo a una temperatura baja para obtener un valor grande de T, y con un campo estático B 0 tan grande como sea posible para satisfacer el requisito de que w 0 sea una frecuencia de microonda experimentalmente accesible. Por otro lado, en el caso de las mediciones del efecto de Hall, el objetivo a menudo es lograr que w 0 T sea mucho menor que la unidad para simplificar la interpretación de los datos. Cuando el efecto de resonancia de ciclotrón en el silicio y el germanio se estudió de una manera experimental, se descubrió que para ambas substancias existen

Resonancia de ciclotrón y superficies elipsoidales de energía

319

más de dos resonancias (una para los electrones y otra para los huecos), como lo predijo la teoría sencilla que se estudió anteriormente. 5 •6 Más aún, se observó que algunas de las frecuencias resonantes del ciclotrón sufrían cambios notables cuando se alteraba la orientación del cristal con respecto al campo magnético estático, en tanto que otras eran prácticamente independientes de la orientación de la muestra. Estos efectos se explicaron finalmente utilizando un modelo en el que las superficies de energía constante de los electrones, dentro del espacio k, eran elipsoidales más que esféricas, y en donde se consideró la presencia de tres bandas de valencia independientes, dos de las cuales se degeneraban a k = O. Las superficies de energía constante para huecos de estas bandas de valencia son más o menos esféricas, aunque, puesto que a2 e/ak 2 difiere para distintas bandas de valencia, existe más de una masa efectiva posible para los huecos. Las diferentes características de este modelo se han comprobado no sólo mediante la concordancia que tiene con los datos experimentales que se han obtenido, sino también por medio de cálculos de mecánica cuántica de la estructura de bandas de energía que se inician más o menos a partir de los principios. 7 • 8 • 9 En primer lugar se estudiará la cuestión de las superficies elipsoidales de energía y se investigará la forma en que los resultados del experimento de resonancia de ciclotrón se modifican cuando las superficies de energía tienen esta forma. Hasta ahora se ha supuesto siempre que el punto de energía mínima en la zona reducida de Brillouin ocurre a k= O, en el centro de la zona, como se ilustra en la figura 8.6. En este caso, un electrón que se encuentra cerca de la energía mínima presenta el comportamiento dinámico de un electrón libre, conduciendo a una superficie de energía constante que, dentro de esta región del espacio k, es más o menos esférica, como se ilustra en la figura 8.ll(a). Sin embargo, se encontró que el valor mínimo de energía dentro de la zona reducida necesariamente no debía encontrarse en k= O, sino que podía localizarse en cualquier otro punto dentro de la zona. En efecto, esta es la situación que se observó en el caso de los electrones dentro de la banda de conducción del germanio y el silicio. Puesto que la red de diamante, en realidad es dos redes cúbicas centradas en la cara que tienen una interpenetración y que están separadas a lo largo de la diagonal del cubo por una distancia a ..j3/4 (en donde a es el lado del cubo), la célula unitaria primitiva para esta red es la misma que la que se muestra en la figura 1.5, excepto que existe un segundo átomo dentro de la célula. La red recíproca, por ende es la misma de la estructura cúbica centrada en la cara y, por tanto, la zona de Brillouin tiene la misma forma que la zona cúbica centrada en el cuerpo que aparece en la figura 8.14(c). En la figura 9.15(a) se ilustra una gráfica de e en función de k en la dirección (1 00) en esta zona de Brillouin para los electrones de la banda de conducción del silicio. El valor más pequeño de e se alcanza a un valor de k que es aproximadamente 0.8(27T/a). Este es el valor mínimo absoluto de e dentro de la zona de Brillouin. se pueden tener otras curvas de e en función de k para otras direcciones, que presenten otros valores mínimos de e; pero ninguno será tan bajo como el valor ee de la figura. Para energías mayores que ee, se pueden construir superficies de energía constante alrededor del punto de energía mínima. Es obvio que la curva de energía en función de la cantidad de movimiento del cristal de la figura 9.15(a) es aproximadamente parabólica alrededor del punto mínimo, correspondiendo al comportamiento del electrón libre con una masa efectiva 5 6 7 8 9

G. Dresselhaus, A. F. Kip y C. Kittel, Phys. Rev. 92, 827 (1953). R. N. Dexter, H. J. Zeiger y B. Lax,Phys. Rev. 104, 637 (1956). F. Herman, Phys. Rev., 93, 1214 (1954); Proc. lnst. Radio Engrs. 43, 1703 (1955). D. P. Jenkins, Physica, 20, 967 (1954). E. M. Conwell, Proc. Inst. Radio Engrs., 46, 1281 (1958).

320 Semiconductores electrónicos uniformes en equilibrio

••

-;0=-t---------;,---+(a) Silicio Figwa 9.15.



*··

-;o::;t-----------+-k{111)

(b) Germanio

Zona de frontera

La relación de € en función de k para (a) la banda de conducción del silicio graficada a lo largo de la dirección k, (b) la banda de conducción del germanio graficada en la dirección (111) dentro del espacio k.

apropiada que se denominará mjj. Si se graficara la curva de e en función de k a lo largo de una dirección que pase por el punto mínimo, pero perpendicular al eje kx (por ejemplo, una línea paralela al eje ky). también se podría obtener una curva que sería parabólica alrededor del punto mínimo; pero en este caso no se obtiene el aspecto de simetría del cristal que requeriría que la curvatura en esta dirección fuera la misma que se tiene a lo largo de la dirección kx. (Esta situación se ilustra en -la figura 9.16.) Como resultado, la masa efectiva relacionada con los cambios en la componente de h cantidad de movimiento en esta dirección tiene un valor que Como se verá difiere del que se dio con anterioridad y que se designará como en breve, esto hace que los requisitos de la simetría del cristal establezcan que la masa efectiva tenga el mismo valor para cualquier dirección dentro del espacio k, normal a la dirección kx en este ejemplo. La energía que sobrepasa el valor de Ec representa la energía cinética de un electrón libre dentro de la banda de conducción, de donde,

mi.

mi

(9.9-15)

c{k)

- Graficada hacia la dirección *• - - Graficada hacia la dirección k, o

kz

1 1 -4---------------r-----1--k

Figura 9.16.

La relación de E en función de k para la b.anda de conducción del silicio graficada en la dirección k" (curva continua) y a lo largo de una línea normal al eje kx que pasa por el punto kmín (curva punteada). Las diferentes curvaturas en el punto mínimo reflejan la anisotropía de la masa efectiva.

Resonancia de ciclotrón y superficies elipsoidales de energía

321

en donde Pxo = hkxo representa el valor de Px en la base de la banda, como se ilustra en la figura 9.15(a). De acuerdo con esto, la superficie de energía constante de un electrón cuya energía e es ligeramente mayor que Ec, es un elipsoide de revolución cuyo centro se localiza en kx = kxo, ky = kz =O. No obstante, puesto que las seis direcciones (100) de una red cúbica son cristalográficamente equivalentes, la curva de e en función de k en cualquiera de estas seis direcciones debe ser la misma. Entonces, deben tenerse seis mínimos de energía equivalentes a lo largo de las seis direcciones (1 OQ)· y con cada uno de estos mínimos debe asociarse una familia de superficies elipsoidales de energía constante similares a las que se describen en (9.9-15). En la figura 9.17(a) se da una representación de esta situación. Esto pone en claro por qué los elipsoides deben ser de revolución; como se vio en el capítulo anterior, la superficies de energías constantes deben tener todas las propiedades de simetría de la zona de Brillouin que, a su vez, conserva todas las propiedades de simetría de un cristal cúbico. Si los elipsoides no son de revolución, la familia de superficies de energía constante ya no sería invariable en todas las operaciones para las que un cristal cúbico permanece invariable.

(a) Silicio

Figura 9.17.

(b) G~rmanio

Superficies elipsoidales de energía constante dentro del espacio k para (a) el silicio y (b) el germanio. En el primero, los ejes principales de la elipsoide siguen las direcciones {100} mientras que en el segundo, puesto que el mínimo de energía se localiza en la frontera de zona, las superficies de energía constante forman ocho medias elipsoides cuyos ejes principales quedan sobre las direcciones {111}.

La situación para los electrones de la banda de conducción del germanio es algo similar, excepto que se tiene un conjunto de ocho puntos equivalentes de energía mínima que quedan en las direcciones (111) dentro del espacio k en la intersección de tales direcciones con la superficie de la zona de Brillouin. Por tanto, estos mínimos quedan en centros de las caras hexagonales de la zona de Brillouin. Las superficies de energía constante tienen nuevamente la forma elipsoidal; pero, puesto que los mínimos de energía están en la frontera de la zona y, dado que existe una región de energía prohibida bastante amplia que debe vencerse antes de que los electrones puedan excitarse para salir de la zona de Brillouin en estas direcciones, existen ocho mitades de elipsoides que se extiende hacia el interior de la zona de Brillouin en las direcciones ( 111), como se muestra en la figura 9 .l 7(b ). Esto puede considerarse, para muchos fines, como equivalentes a cuatro elipsoides completos. En ambos casos se tiene un tensor de masa efectiva asociado con cada

322 Semiconductores electrónicos uniformes en equilibrio elipsoide cuyos elementos describe la expresión (8.8-7). Al calcular las propiedades de transporte y otras características físicas de los cristales en los que las superficies de energía son elipsoidales, por lo general se determina el efecto debido a una elipsoide (que es casi siempre anisotrópico) y luego se suma sobre todas las elipsoides. Se ha encontrado que las propiedades de transporte en cristales cúbicos son isotrópicas después de efectuar la suma, a pesar del hecho de que las anisotropías se asocian con elipsoidales individuales. Tanto en el germanio, como en el silicio, el efecto lortgitudinal de la masa es mucho mayor que la masa transversal de donde, los elipsoides son muy largos y delgados. Los valores reales, tal como se determinan mediante los experimentos de resonancia de ciclotrón, 5 son los que aparecen en la tabla 9.2.

mW

m!,

TABLA 9.2. Masas efectivas de electrones en el germanio y el silicio "relación de masas"

mW/m!

m! Germanio Silicio

20.0

0.0819 mo 0.19 mo

1.64 mo 0.98 mo

5.2

A continuación se investigará el efecto de resonancia de ciclotrón en materiales en los que las superficies de energía son elipsoidales. Para principiar, se calculará la frecuencia de resonancia asociada con un solo elipsoide que se supondrá simétrico alrededor del eje kz y que está centrado en el punto kzo, como se indica en la figura 9.18. La inducción magnética B0 forma un ángulo 8 con el eje principaf del elipsoide y, para mayor facilidad, se supondrá que el vector del campo eléctrico oscilante tiene sólo una componente y. La selección de este sistema de coordenadas se hace sólo con el fin de realizar estos cálculos y, cuando concluyan, se verá que la única coordenada de importancia física es el ángulo () entre el campo y el eje longitudinal del elipsoide. En estas circunstancias, la ecuación de movimiento (para una partícula de carga positiva e) se puede escribir en función del tensor (8.8-6) que representa la recíproca de la masa efectiva como -dv = ( - 1 ) · F = ( - 1 ) • (eE +-e v X B). dt m* m* e

(9.9-16)

La relación entre e y k para el caso de la superficie de energía elipsoidal que se mu-:,tra en la figura 9.18, debe ser, de acuerdo con (9.9-15), _

¡¡

_

,. 2 [k~ +k~

¡¡e-"

* +

2m.L

(k.- k. 0) 2 ]

*

2m 11



(9.9-17)

Las componentes del tensor (1/m*)«fl se pueden encontrar ahora de acuerdo con (8.8-7). En este caso, a2 ejakaakfJ =O para oc"" {J, de tal manera que todos los

Resonancia de ciclotrón y superficies elipsoidales de energía

Figura 9.18.

323

Geometría vectorial usada en el cálculo de la sección 9.9.

elementos del tensor que quedan fuera de la diagonal son cero. Los elementos de la diagonal se calculan fácilmente y el resultado es (1/m*)xx = (1/m*)yy = 1/m!

(1/m*)u = 1/mjj ·

y

(9.9-18)

De donde, el tensor de la masa efectiva tiene la forma 1

o

mi

o

(~.) = o

m1

o

o

o

(9.9-19)

1 ---¡ mil

y

1

m1

o

o

1

o

(~.). F = o

m!

o

o

1

m•u

.

Fx

Fxfm!

F,

F,/m!

Fz

Fzfmii .

(9.9-20)

Si se insertan las componentes de la fuerza de Lorentz para Fx, Fy y Fz, y se igualan a lar. componentes de dvfdt, como lo requiere (9.9-16), la ecuación rlel

324 Semiconductores electrónicos uniformes en equilibrio movimiento se puede escribir como sigue

(9.9-21)

Si se observa que Bx =bo sen8,Bz =Bo cosO, By= O,Ey =E0 eiwt,Ex =Ez= O. estas ecuaciones se pueden expresar como

(9.9-22)

dv.fdt

=-

w 11 vY sen(}

en donde y

eB 0

W¡¡

= -.-. m c

(9.9-23)

11

Al igual que antes, se pueden suponer soluciones oscilatorias de la forma x(t) = x 0 eiwt, y(t) = y 0 eiwt, y z(t) = z 0 eiw t, substituyendo éstas en las ecuaciones de movimiento (9.9-22) y resolviendo para las amplitudes,

(9.9-24)

iw 11 sen (}

eE 0 Zo

= -

mi w(w

2 -

wf cos 2 ( } - wJ.wll sen 2 8) ·

Estas amplitudes se hacen muy grandes cuando (9.9-25) y este> ·.oncuerda con la frecuencia de resonancia de ciclotrón para el elipsoide partirnldf que se está estudiando. La frecuencia de resonancia depende sólo del ca•¡,po magnético, las masas efectivas y el ángulo (} comprendido entre el campo 8 0 :. el eje principal de la elipsoide. Para superficies de energía elipsoidales, es evidente que la frecuencia de resonancia es una función fuerte de la orientación de la mues· tra con el campo magnético. Se puede demostrar que, a la frecuencia de resonancia.

Resonancia de ciclotrón y superficies elipsoidales de energía

325

las órbitas de la partícula son elípticas, de acuerdo con (9.9-24) y que quedan en un plano perpendicular al campo B0 . Los resultados anteriores se derivaron para partículas positivas con carga e; pero para el caso de los electrones sólo se necesita substituir e con -e (en cuyo caso también se debe hacer la substitución de wll por - w 11 y w 1 por - w 1). Evi den temen te, la frecuencia de resonancia no la alteran estas substituciones; la única diferencia es que los electrones atraviesan sus órbitas en el sentido opuesto del que se encontró para las partículas positivas. En el caso del silicio, si el campo B0 se orienta en la dirección z, entonces (} = O para las dos elipsoides cuyos ejes principales se encuentran a lo largo de la dirección kz y (} = 90° para los otros cuatro elipsoides. Entonces, de acuerdo con (9.9-29), habrá dos picos de resonancia superpuestos en w = w1 de los dos primeros elipsoides y cuatro resonancias superpuestas a w = ..jw1w 11 de los otros cuatro. Suponiendo que el número de electrones pertenecientes a cada elipsoide es igual, lo cual es cierto en la condición de equilibrio, la segunda resonancia que cubre cuatro elipsoides debe tener el doble de la fuerza de absorción de la primera, que sólo cuenta con dos. Si el campo B0 tiene otra orientación, se pueden encontrar hasta tres tipos de resonancia correspondientes a los tres ángulos posibles entre B0 y los ejes de la elipsoide. Esta teoría de la resonancia de ciclotrón con las superficies de energía elipsoidales sirven para explicar todas las resonancias observadas experimentalmente, que se ven muy afectadas por la orientación de la muestra, y permite determinar m l y m~ basándose en frecuencias de resonancia de ciclotrón determinadas de un modo experimental, y así se pudo proponer un modelo correcto para la orientación de las elipsoides. Los datos de resonancia de ciclotrón para huecos en las bandas de valencia del silicio y el germanio no presentan las características típicas del efecto con superficies de energía elipsoidales. Aunque en ambos materiales existen numerosos picos de resonancia para los huecos, los cambios característicos de la frecuencia de resonancia con la orientación de la muestra que se observan en las superficies elipsoidales de energía, están ausentes o son mucho menos pronunciados. El modelo de la banda de valencia que parece ajustarse mejor a estos (y otros) datos, es el de dos bandas separadas que se degeneran en el máximo de energía en k = O; pero que tienen diferentes masas efectivas. Existe también una tercera banda "de separación" con una energía máxima (en k = O) un poco inferior a la parte superior de la banda de valencia. En la figura 9.19 se ilustra esta situación. Están presentes simultáneamente

Figura 9.19.

Las tres distintas ramas de las bandas de valencia del silicio y el gennanio.

326

Semiconductores electrónicos uniformes en equilibrio

huecos ligeros y pesados (pertenecientes a las bandas l y h de la figura), y se puede observar un efecto de resonancia de ciclotrón diferente para cada tipo. Puesto que las l..Jperficies de energía asociadas con estas bandas son más o menos esféricas, la dependencia de la orientación que tiene el efecto de resonancia de ciclotrón es mucho menos pronunciada que la que se asocia con las superficies elipsoidales de la banda de conducción. No obstante, las superficies de energía son aproximadamente esféricas; están algo distorsionadas de la forma realmente esférica, incluso para valores pequeños de k. Esta "desviación" debe tomarse en cuenta para explicar todos los detalles de los datos de resonancia de ciclotrón, sobre todo en el caso de la banda de huecos pesados en donde la desviación de la esfericidad es más pronunciada. La diferencia de energía entre el punto máximo de la banda "de separación" de posición más baja y el máximo de la banda de valencia (ev- €8 en la figura 9.19). es aproximadamente 0.28 eV en el germanio y 0.035 eV en el silicio. En el caso del germanio, esta diferencia de energía es lo suficientemente grande para que en condiciones ordinarias, se desprecie la población de los huecos de la banda más baja. Sin embargo, en el caso del silicio, excepto a temperaturas bajas, se encontrará un número importante de huecos en esta banda. La separaclón de las bandas se debe a la interacción de los espines electrónicos de los electrones de valencia con el momento magnético producido por su movimiento orbital. Si no fuera por este acoplilmiento esptn-órbita la diferencia de energía €v - e8 sería cero y las tres band~ coincidirían en el punto k= O. Las masas efectivas asociadas con las tres variedade de huecos se dan en la tabla 9.3.

TABLA 9.3. Masas efectivas de huecos en el germanio y el silicio

Germanio Silicio

0.044mo 0.16 mo

0.28 mo 0.49 mo

0.077 mo 0.245 mo

La existencia de un hueco como una especie particular, en general, está limi· tada a un solo tiempo libre medio. Por ejemplo, un hueco se puede dispersar fácilmente de la banda l a la banda h, o viceversa, mediante cualquiera de los procesos de dispersión con los que normalmente se asocia. Por esta razón no es posible detectar la existencia de las variedades independientes de huecos en cualquier medi· ción (por ejemplo, la conductividad o· el arrastre de portadores) que implica sólo el comportamiento promedio del portador promediado sobre un gran intervalo durante el que las identidades de los huecos dentro de las tres bandas pueden intercambiarse con frecuencia. En el experimento de la resonancia de ciclotrón, en donde se mide una resonancia que se excita en un tiempo corto en comparación con el tiempo libre medio (w 0 r ;:¡¡:. 1), se puede manifestar fácilmente la presencia de algunas varie· dades de huecos. Se puede hacer la misma observación en relación con los electrones en los diferentes mínimos equivalentes de energía de la banda de conducción; los procesos normales de dispersión pueden transferir electrones sin más problemas, de una elipsoide a otra (dispersión entre valles), de tal manera que en un tiempo largo en comparación con el de relajación, se pierde irrecuperablemente la identidad de un electrón que indica a qué elipsoide en particular pertenece.

Densidad de estados, conductividad y efecto de Hall 9.10

327

DENSIDAD DE ESTADOS, CONDUCTIVIDAD Y EFECTO DE HALL CON SUPERFICIES COMPLEJAS DE ENERGIA

En una situación en donde existen dos bandas parabólicas que se degeneran en k = O, con superficies de energía esféricas que dan origen a dos especies diferentes

de portadores, las poblaciones relativas de las dos especies y los factores de densidad de estados se pueden calcular con facilidad. Se analizará el caso de una banda de valencia de esta naturaleza en la que se encuentran presentes simultáneamente huecos ligeros (con una masa efectiva mt) Y huecos pesados (con una masa efectiva m~). En estas circunstancias, el total de concentración de huecos p 0 se puede escribir como la suma de la concentración de huecos ligeros p1 y la de huecos pesados Ph• de donde, de acuerdo con (9.3-15) y (9.3-16),

(9.10-1)

en donde Uv 1 y Uvh son factores de la forma (9.3-16) para huecos ligeros y pesados. Esto se puede escribir en la forma

- (2nm;.kT)3/2 -c•,-•.>fkT h2 e '

Po- 2

(9.10-2)

como si se tratara de una sola especie de portadores, si se define la masa efectiva equivalente de la densidad de estados m~ 9 , como (9.10-3)

Esta es una aproximación de la situación real en la banda de valencia del germanio y el silicio, aunque es sólo aproximada, ya que el efecto de la banda "de separación" se hace a un lado por completo y dado que las superficies reales de energía no son perfectamente esféricas en modo alguno. La conductividad procede directamente de (9.10-2) utilizando (4.7-8). Para un grupo de superficies elipsoidales de energía tales como las que se vieron en relación con la banda de conducción del germanio o el silicio, se puede calcular el factor de densidad de estados g(e) mediante una extensión del procedimiento desarrollado en la sección 5.2. La ecuación (9.9-17) para una de las elipsoides se puede reducir mediante la transformación

(9.10-4)

a la de una esfera dentro del espacio p'. 8 - Be=

p~2

+ p'2 + p'2 >'

2m 0

z

p'2 =

2m 0 •

(9.10-5)

328 Semiconductores electrónicos uniformes en equilibrio El volumen del espacio p' de la capa esférica limitada por los radios p' y p' + dp' para una sola elipsoide, ahora se puede calcular del mismo modo que se hizo en la sección 5.2 para las superficies esféricas de energía; pero puesto que se tiene más de una superficie elipsoidal de energía constante, el volumen total del espacio p' correspondiente a las energías dentro del rango e a e+ de, se obtiene multiplicando el volumen encontrado para una sola superficie por el número de elipsoides equivalentes. Si este número es v, el volumen correspondiente dVp, dentro del espacio rJ es

(9.10-6) Sin embargo, de acuerdo con (9.10-4), los elementos de volumen dV = dpxdPydPz y dVP' = dPx•dPy•dPz' están relacionados por medio de m~/2

dVp' = ( m.~.*2 m*)1/2 dVP,

(9.10-7)

11

por lo cual, el volumen dVP del espacio p dentro del rango de energía e a e+ de. se convierte en dVP-- 4V¿. '2nv(m*.l. 2 m*) 11 112 Je - ee de •

(9.10-8)

Al dividir esto entre el volumen h 3 /2 asignado a un solo estado cuántico, se obtiene el número de estados cuánticos dentro de este rango de energías que, por definición, es g(e)de, de donde, 8 ¡;;2 ( *2 *)1/2 ( )de -_ ...; ...nv hm.~. m 11 3

g e

J-e - ee de.

(9.10-9)

Si de nuevo se define una masa efectiva equivalente de densidad de estados m~ 9 , como

*3/2 _ (m*2m*)1/2 m ds .l. 11 '

(9.10-10)

la ecuac10n (9.10-9) se puede escribir (excepción hecha del factor v) en la misma forma (5.2-22) como la expresión acostumbrada de la densidad de estados para el caso en que las superficies de energía son esféricas. Aplicando directamente los procedimientos por los que se obtuvieron (9.3-6) y (9.3-7), es claro que se debe obtener

(9.10-11) siendo r,¡Js como lo indica (9.10-10). Al calcular la conductividad de un semiconductor en el que las superficies de energía constante son elipsoidales, primero es necesario determinar la contribución de eurriente o conductividad para una sola elipsoide y luego sumar sobre todas las elipsoides para determinar la conductividad total. Puesto que la masa efectiva asociada con cada elipsoide individual es una cantidad tensorial, también lo será la conductividad. En general, las ecuaciones relacionadas con la densidad de corriente y el

Densidad de estados, conductividad y efecto de Hall

329

campo eléctrico se pueden escribir como relaciones tensoriales de la forma (9.10-12) y

E=

p· 1

(9.10-13)

en donde a es el tensor de conductividad y p es un tensor de resistividad. Evidentemente, pÜesto que de acuerdo con (9.10-12) (9.10-13),

y

e · 1 = e · ~ · E = E,

(9.10-14)

se de be tener (9.10-15) en donde ! es el tensor unitario cuyos elementos son {Ja. 8 . En consecuencia, el tensor de resistividad es la inversa del tensor de conductividad, es decir, (9.10-16) Los elementos del tensor de cvnductividad a
en donde rl(i) es la densidad de portadores de carga asociados con dicha elipsoide. Por tanto, la conductividad total se puede expresar como (9.10-18)

y la suma se hace sobre todas las elipsoides. Si se usa (8.8-7) para expresar las componentes tensoriales (9.1 0-17) se puede escribir como sigue

a2¡p> ak X2

. n< 0e 2i ¡J2¡;(i) a<•>= - 1i2 oky okx a2e(i) ok% okx

a2e(i)

a2e(i)

okx oky o 2e(i)

okx okz a2e(i)

o~k2y a2¡; okz oky

aky ak% ' o 2e(i)

(9.10-19)

ok z2

en donde ¡;(i)(k) es la energía expresada en función de k para la iésima elipsoide. En el caso del silicio, los principales ejes de las elipsoides yacen a lo largo de los ejes de coordenadas del espacio k; para las dos elipsoides cuyos ejes principales quedan sobre el eje kz, en las direcciones [001] y [001], la función ¡;(OOI)(k) está dada por (9.9-17), lo cual conduce a las componentes de tensor (9.9-18) para el tensor

330 Semiconductores electrónicos uniformes en equilibrio de conductividad para estas elipsoides se convierte, entonces, en 1

m! a
= ae2i o

o

o

o

1

o

m!

(9.10-20)

o m¡¡1 *

Las ecuaciones de las otras elipsoides se pueden escribir y los componentes de tensor se obtienen de la misma manera. Para las dos elipsoides cuyos ejes principale1 se orientan a lo largo del eje kx, 1

o

o

o

1 m*J.

o

o

o

1 m*J.

*m u CJ(lOO)

= CJ(TOO) = n(lOO)e2i

(9.10-21)

en tanto que, para los dos elipsoides cuyos ejes principales siguen la dirección de: eje ky,

1

m! CJ(OlO)

= CJfOTO) = n(010)e2i o

o

o

o

1

o

*m u o

(9.10-22)

1

m!

Dado que las seis elipsoides tienen mínimos de energía equivalente n(loo) = n<1oo) = n
1( 2 1) o o 3 m!+ m 0 1( 2 1) o o 3 m!+ m 0 1( 2 1) o o 3 m!+ m0 1 ( --¡ 2 = n 0 e 2 i -3 m1.

1 +* m

11

)t_

(9.10-23)

para la conductividad total. Puesto que CJ es un múltiplo escalar del tensor unitario !_, la conductividad total es isotrópica (a -pesar de que la conductividad asociada con

Densidad de estados, conductividad

y efecto

de Hall

331

una sola elipsoide no lo sea). La magnitud escalar de la conductividad se puede representar como (9.10-24)

en donde m~ es una masa efectiva de conductividad defmida por

l.

1( 2

m: =

3

1)

m!

+ m¡j

·

(9.10-25)

Se puede demostrar que se obtendría exactamente el mismo resultado para cualquier conjunto de superficies elipsoidales de energía de que se trate, siempre y

cuando la configuración sea invariable en todas las operaciones de simetría en las que el cristal cúbico sea inalterable. De hecho, se puede demostrar que la conductividad de todos los cristales cúbicos debe ser isotrópica sea cual fuere la forma específica que puedan tomar las superficies de energía constante. En particular, las ecuaciones (9.10-23) a (9.10-25), también son válidas para los electrones de conducción en el germanio, en donde las elipsoides de energía constante están orientados a lo largo de las direcciones (111). Es muy ilustrativo desarrollar el tensor de conductividad para el germanio, y este problema queda asignado como ejercicio para el lector. El tensor de resistividad es una matriz de componentes inversa a la matriz de conductividad. Lo elementos de la matriz que es la inversa de la ~ cuyos elementos son a,.11 están dados por la fórmula

e

_ 1

a,.p =

cof(a 11,.) á(a) '

(9.10-26)

en donde cof (a11,.) es el cofactor 10 del elemento a11,. y A(a) es el determinante de los coeficientes de ~· En consecuencia, es evidente que los elementos de e_ son

anayz

-

a:x:yarr

a""a•• - a;.

(9.10-27)

en donde

(9.10-28)

Se ve claramente que si a tiene la forma (9.10-23), el tensor de resistividad es isotrópico y se puede represeñtar mediante una cantidad escalar cuya magnitud es, sencillamente, el recíproco de la conductividad (9.10-24). A continuación se ilustrará la computación del efecto de Hall en un material con superficies elipsoidales de energía, considerando en detalle el efecto de Hall en lO Véase, por ejemplo, L. A. Pipes, Applied Mathematics for Engineers and Physicists. Nueva York. McGraw-Hill (1946), página 71.

332 Semiconductores electrónicos uniformes en equilibrio un material en el que los ejes principales de las elipsoides se extienden a lo largo de los ejes kx, k y y kz (como por ejemplo, en el silicio), en el caso espec:al en el que el campo magnético está orientado en la dirección z y la corriente fluye en la dirección x. También se supondrá que existe sólo una especie de portadores. En estas condiciones, los tensores inversos de la mas.a efectiva para diferentes elipsoides tienen la forma que se señala en las ecuaciones (9.10-20, 21 y 22) y, en particular. la ecuación tensorial de movimiento para portadores con carga e en los elipsoides (100) y (TOO), se pueden escribir, en analogía con (9.8-4), como 1

e

o

eEx

+-e (v,B.

- v.B,)

dvxfdt

1 (~.).! = o mi o

eE7

+ - (v.Bx- vxB.)

dv7 /dt

eE.

+-e (vxBy- v1 Bx)

o

mn*

o

o

1

mi

e

e e

(9.10-29)

dv.fdt

Si se hacen las multiplicaciones de matriz indicadas, se escriben las ecuaciones de las componentes del movimiento y se observa que Bx =By =O, en tanto que Bz = 8 0 se obtiene dvx eEx -=-+w 11 v7 dt mjj dv,

eE,

dv.

eE.

dt = mi- WJ.Vx (9.10-30)

dt= mi'

en donde wll y w 1 son como se indica en {9.9-23). _ _ Si la primera de estas ecuaciones se multiplica por yw1 y se suma a iywll por la segunda, la ecuación resultante se puede expresar en la forma dZ -d t

. ~ iJW"; E,) + !y ro 11 roJ.Z =e (JroJ. -.-Ex+--.-

m 11

(9.10-31)

mJ..

en donde Z es la cantidad compleja

z = vxJwJ. + iv,Jwn.

(9.10-32)

Evidentemente, la ecuación (9.10-31) tiene exactamente la misma forma que (9.8-8). Todos los pasos comprendidos en la solución de esta ecuación y el promedio sobre las trayectorias y la distribución de velocidad que conducen a las ecuaciones (9.8-16) y (9.8-17), se pueden repetir ahora principiando con (9.10-31). La justificación física de cada etapa es la misma que ya se dio. De esta manera, se puede demostrar que ii~too) = ii~Too> =

1

-

~ Re(Z)

yC.OJ. (9.10-33)

Densidad de estados, conductividad y efecto de Hall

333

mientras que T

¡;~too> = ¡;~

oo> = -1= lm(Z)

Jwu

(9.10-34)

Si estos resultados se restringen al coeficiente de Hall de campo pequeño, se puede suponer wnwlr 2 ~ 1 y dejar sin efecto los términos wnwlr 2 de los denominadores de las ecuaciones (9.10-33) y (9.10-34). Ahora se pueden obtener las densidades de corriente a partir de las velocidades, al igual que antes, de donde, para la iésima elipsoide, ¡ev

y

y

o

y '

(9.10-35)

mientras que, sumando todas las elipsoides, las componentes del total de densidad de corriente son 1X = "L.- p(i>ev o X

J~i)

y

i

=¿

pg>ev~i)·

(9.10-36)

i

En el estado estacionario no puede haber una corriente en la dirección y, de modo que, de acuerdo con (9.10-36), se debe tener (9.10-37)

Como se dijo antes, las concentraciones p~> para las ~eis elipsoides son las misma e iguales a p 0 /6. La expresió~ para vvoo) y ii~ 100 ) se dio antes en (9.10-34). Para las elipsoides (010) y (010), se puede establecer fácilmente, usando el tensor de masa apropiado en (9.10-29), que las ecuaciones de movimiento para las componentes x y y de la velocidad son las mismas que las que se dan en (9.10-30), excepto que ~e intercambian mjj y m! y wu y w1 . Entonces, la expresión para ¡¡~o1o) y ¡;~0 1 0) es (9.10-34) intercambiando estas cantidades. En el caso de las elipsoides (001) y (OOI), es obvio, siguiendo el mismo razonamiento, que las ecuaciones de movimiento de las componentes x y y de la velocidad son las mismas que las de (9.1 0-30), excepto que mjj y w 11 no aparecen en absoluto y que, en todo_§ los casos, se substituyen por mi y w 1 . De donde, la expresión de ¡;}0° 1 ) y P}001 ) se obtiene a partir de (9.10-34), substituyendo mjj y wu por mi y w1. Después de hacer todas estas substituciones, efectuar la suma indicada en (9.10-37) y resolver para Ey en función de Ex. se obtiene _ eB 0 E,- 7

2mt f m1

2 (' )

i

•2

"'(

2

1 ) Ex.

(9.10-38)

m1. m 11 ---¡ +---¡ m1. m 11

Desechando los efectos de la magnetorresistencia, que no son importantes para fuerzas reducidas de campo magnético, Ex se puede expresar en términos de lx de acuerdo con (9.10-24) como sigue Ex= lx/t1o =

31 x ( 2 Poe2 i---¡

m1.

.

1) +---¡ m 11

(9.10-39)

334 Semiconductores electrónicos uniformes en equilibrio Al substituir esto en (9.10-38), se puede escribir finalmente

(9.10-40) siendo _ _1_ -r 2

R-

p0 ec (i)

3(2m! 2

+ mjj)

*2 • ( 2 1) m.~. m -;¡;+11

m.~.



(9.10-41)

ut

Esto se escribe a menudo de una manera. algo diferente; si K se defme como la relación de la masa longitudinal a la transversal, según lo cual,

(9.10-42) entonces, (9.10-41) se puede expresar como 1 T 2 3K(K + 2) R = -p0-ec -(i-)2 ~(2:-K.:......._+-:-1)=2 •

(9.10-43)

Aunque se supusieron direcciones particularmente simples para la corriente de la muestra y el campo magnético, si se hubiera procurado obtener el resultado para una dirección arbitraria de flujo de corriente u orientación de campo, se habría descubierto que el coeficiente de Hall de campo pequeño {9.10-41) ó (9.10-42) es independiente de la orientación de la corriente y la dirección de campo con respecto a las elipsoides de energía. Por tanto, se puede demostrar que el coeficiente de Hall de campo pequeño es isotrópico, aunque esto no es correcto si el campo magnético es tan grande que w uw 1T 2 ya no sea pequeño en comparación con la unidad. Los resultados anteriores se obtuvieron también para un conjunto particularmente sencillo de elipsoides de energía; pero se puede demostrar que se aplican a cualquier grupo de super· ficies elipsoidales de energía, siempre que dicho grupo tenga una simetría cúbica. Por supuesto, estos resultados se desarrollaron para portadores con una carga +e. Para semiconductores tipo n (y Si y Ge tipo n son los ejemplos más comunes de substancias con superficies elipsoidales de energía), se debe substituir e por medio de -e y p 0 con n 0 en (9.10-41) y (9.10-43). Si la ecuación (9.10-43) se multiplica por a0 y si la cantidad Ra0 se defme, al igual que antes, como la "movilidad de Hall" Jl.H, es obvio que la relación de la movilidad de Hall a la movilidad de arrastre real J1. está dada por JlH

T2

¡; = (t)2

3K(K + 2) (2K + 1)2

(9.10-44)

para un semiconductor con superficies de energía constante elipsoidales. El presentar una exposición completa de los efectos galvanométricos y la magnetorresistencia para semiconductores con superficies elipsoidales de energía es algo que están más allá del alcance de esta obra y, por ende, se omitirá. Sin embargo, se debe hacer notar especialmente que la magnetorresistencia no es isotrópica en estas condiciones y que las mediciones de ésta, en func\ón de la orientación de la muestra y la dirección del campo magnético pueden constituir una fuente abundante de datos experimentales con los que se puede comprobar en detalle cualquier modelo propuesto de superficies de energía.

Mecanismos de dispersión y movilidad de los portadores de carga 9.11

335

MECANISMOS DE DISPERSION Y MOVILIDAD DE LOS PORTADORES DE CARGA

En los semiconductores, al igual que en los metales, los procesos de dispersión más importantes incluyen las interacciones de los electrones (o huecos) con las vibraciones de red y con átomos de impureza. En cristales relativamente puros o a temperaturas más o menos altas, la primera interacción es casi siempre predominante en tanto que a temperaturas bajas o en especímenes impuros, la segunda parece ser más importante. Existe un amplio rango de posiciones intermedias en las que ambos procesos son significativos. El efecto de cualquier interacción de dispersión, particular i, se puede evaluar calculando el tiempo libre medio T ¡ asociado con este proceso. Entonces, el tiempo libre T se puede expresar mediante 1 1 -=¿-r i

(9.11-1)

'r¡

como se indicó en la secc10n 7.5. Esto pone en claro que el proceso de dispersión que conduce al tiempo libre más corto T¡, es el dominante. Una vez que se conoce el tiempo libre medio T, la movilidad se puede expresar fácilmente como e1' /m*. Desafortunadamente el cálculo del tiempo libre asociado con cualquiera de los procesos de dispersión que tienen cierta importancia en los semiconductores, es muy prolongado y elaborado, y los detalles matemáticos que comprende están por encima del nivel que se ha fijado para este estudio. Por tanto, será necesario limitar este análisis a un planteamiento cualitativo más o menos aproximado de la dispersión de red, aunque se tratará de dar un método más o menos completo de la dispersión de impurezas siguiendo el lineamiento que desarrollaron Conwell y Weisskopf. 11 A temperaturas bajas, es muy limitada la energía térmica disponible para excitar vibraciones de red de modo óptico, y el proceso de dispersión de la red, más importante, es la dispersión de portadores de carga mediante vibraciones de la red de modo acústico. Sólo se tendrá en cuenta la dispersión de portadores mediante vibraciones de tipo longitudinal; la razón por la que se desecha el efecto de los modos transversales quedará demostrado en el curso de este estudio. El paso de una vibración longitudinal a través de un cristal da origen a regiones alternas de compresión y expansión de dicha red cristalina. Cuando el cristal se comprime, las posiciones de las bandas de energía se alteran de tal manera que la anchura de la banda prohibida se reduce (véase la figura 9.2); en la condición de expansión, la anchura de la banda prohibida se incrementa . .&te efecto produce una variación local en la energía asociada con el borde de la banda de conducción, como se indica en la figura 9.20(a), que, para simplificar el cálculo, se puede substituir con la variación escalonada que aparece en la figura 9.20(b) sin introducir un error importante. Existe una variación similar en energía del borde de la banda de valencia. Por tanto, se puede calcular la probabilidad de reflexión para un electrón incidente sobre un solo "escalón" de la figura 9.20(b). Para hacer esto, el electrón incidente sobre un escalón de esta naturaleza, con una altura liec se representa mediante una función de onda de partícula libre con una cantidad de movimiento positiva de la forma

(9.11-2) 11

E. Conwell y V. F. Weisskopf, Phys, Rev., 71, 388 (1950).

336

Semiconductores electrónicos uniformes en equilibrio

-----

<e

-x

•• s.c

(a)

1
Figura 9.20.

(b)

_r--------,L . . , _

La variación sinusoidal de las energías de l¡¡ banda de conducción y la de valenca en un cristal semiconductor, producida por fuerzas de compresión y t.xpansióc asociadas con una vibración térmica longitudinal. (b) Una variación "de onch cuadrada" que se aproxima a la ilustrada en (a) y que simplifica el cálculo de! tiempo de relajación.

Como se ilustra en la figura 9.21, el electrón se puede "reflejar" o transmitir en el escalón. De aquí que pueda haber una componente de la función de onda asociada con una cantidad de movimiento negativa en la región (x < 0), representando al electrón reflejado que debe tener la forma

(9.11-3) En la regwn que queda más allá de la barrera (x >O), la función de onda que representa a un electrón transmitido sobre dicha barrera es

(9.11-4) Todas éstas son funciones de onda de partícula libre que satisfacen la ecuación de Schrodinger para un potencial constante. Puesto que la cantidad de movimiento liko para la componente reflejada se supone idéntica a la cantidad de movimiento de la partícula incidente, se supone que la interacción de colisión es perfectamente elás· tica. Sin embargo, puesto que la onda de la red representada por la barrera de energía, se desplaza con la velocidad del sonido, en realidad existe un efecto de Doppler que hace que la cantidad de movimiento reflejada sea diferente de la incidente. Dado que la velocidad del sonido es pequeña en comparación con la velocidad térmica promedio de la partícula, el cambio de cantidad de movimiento es sólo una fracción pequeña de la cantidad de movimiento de la partícula incidente y, por ende, se puede omitir sin riesgo alguno en estos cálculos. De acuerdo con (4.9-8). es obvio que si la energía de un electrón incidente es e0 y la de un electrón "transmitido" es e 1 ,

y

(9.11-5) Transmitida= 'i3(xl-

lncidente =.¡,, (x) - - -

1

¡

Reflejad:< _=_.¡,2_(_x_l_ __ - _ _ _ __, ___sj~

_

x-

1 x=O

Figura 9.21.

La "reflexión" de un electrón desde una barrera de potencial cuya altura es liec.

Mecanismos de dispersión y movilidad de los portadores de carga

337

de donde,

(9.11-6) Puesto que la función de onda y su derivada deben ser continuas en x puede escribir

= O,

se

(9.11-7) y

1/lí(O) + 1/12(0) = 1/13(0). Al substituir los valores dados en (9.11-2, 3 y 4) en estas ecuaciones, se puede demostrar que B k 0 - kt -=--A k 0 + kt

y

e

-=

A

2k0 k0 + k 1 ·

(9.11-8)

Las probabilidades de transmisión y reflexión R y T están dadas por

(9.11-9) (9.11-10) Si la altura del escalón liec es pequeña, lo que se supondrá en este caso, de acuerdo con (9.11-6) k 1 ===k0 , y (9.11-9) se puede expresar con la ayuda de esta aproximación y (9.11-6), como

)2

( m*& R ~ 2¡2k¡ .

(9.11-11)

La cantidad liec se puede relacionar con la deformación de compresión o expansión li V/V0 a una primera aproximación mediante una relación lineal de la forma - «5V - «5ec = .::.e • Vo '

(9.11-12)

en donde la constante del potencial de deformación Zc representa el cambio en el borde de la banda de conducción por unidad de deformación de dilatación. Puesto que las distorsiones cortantes asociadas con los modos de vibración transversales no producen ningún cambio de primer orden en el volumen, estas vibraciones no originan ningún cambio en Ec y su efecto de dispersión en los portadores de carga es despreciable. El paso de una onda elástica longitudinal por el cristal va acompañado, no obstante, de regiones coherentes de compresión y expansión que son del orden de 1/2 en extensión lineal, en donde l es la longitud de onda de la perturbación. Si un elemento de volumen V0 de esa extensión lineal se

338

Semiconductores electrónicos uniformes en equilibrio

somete a un esfuerzo de dilatación produciendo una presión maxnna {)p y un cambio de volumen {j V, se ve claramente que la energía de deformación almacenada :-s --tDP {j V, y si la fuente de la energía de deformación es térmica, su magnitud de~ ser proporcional a kT; en otras palabras,

oe = -!op oV= ckT

(9.11-131

en donde e es una constante.l 2 Sin embargo, puesto que la compresibilidad (3 se define como (9.11-141

se puede expresar en función de (3 gracias a esta ecuación, y substituir el resu1tado en (9.11-13) con el fin de obtener

{)p

1 (oV) 2 Oe=---=ckT 2 {JV0

(9.11-15.

de donde, (oV) 2

V~

2cf:JkT

=-y;-

(9.11-161

Si se substituye este resultado en (9 .11-12) y se usa la expresión resultan te para oe~ en (9.11-11), R se puede escribir como (9.11-171

Ahora, en una distancia ox, la probabilidad de dispersión (reflexión) es ox/"An. en donde An es la trayectoria libre media. Para una distancia l/2 (la dimensión lineal del volumen V0 ), la probabilidad de reflexión es aproximadamente el valor dadc como R en la expresión anterior. Entonces, l/2"An se puede igualar a R y resolverse para An, a fin de obtener (9.11-181

La segunda expreswn procede de la primera, ya que V0 = P /8 y k 0 = 21rjl Suponiendo que An es independiente de la velocidad cuya validez aproximada se vio ya en la sección 7.5, An y el tiempo libre medio se relacionan mediante la expresión (7.3-18). Usando esta ecuación y la expresión (5.4-20), :¡= n se puede expresar en la forma (9.11-19)

12 Esta constante se relaciona principalmente con la fracción de todos los modos normales posibles de vibración que contribuyen a una deformación de dilatación del tipo que se vio aquí. Es evidentemente independiente de la temperatura, la masa efectiva y la constante del potencial de deformación.

Mecanismos de dispersión y movilidad de los portadores de carga

339

Este cálculo es evidentemente aproximado. Sobre todo, se observa que no se ha intentado evaluar c. No obstante, ilustra con claridad los principios comprendidos y también muestra la dependencia de Tn y, por tanto, de la movilidad con respecto a la temperatura, la masa efectiva y la constante del potencial de deformación. Un planteamiento completo de acuerdo con la mecánica cuántica 13 da el resultado (9.11-20}

en donde c11 es la constante de elasticidad para una expansión longitudinal en la dirección [110]. La movilidad correspondiente es ei J.l.n = m:

Jsn:

eli 4 c11 = -3- m:312(kT)3f2E;.

(9.11-21)

Si las superficies de energía constante son elipsoidales más bien esféricas, [de acuerdo con (9.11-5)], es obvio, que la masa efectiva m:; en (9.11-17, 19 y 20) debe reemplazarse con la masa efectiva de densidad de estados (9 .1 0-1 O). El factor adicional de m~ que aparece en (9.11-21), debe ser en este caso, la masa efectiva de conductividad (9.1 0-25), de tal modo que el factor m:;s 12 del denominador de (9.11-21), se convertirá en m~ 9 3 1 2 m~. Los cálculos anteriores se refieren específicamente a electrones en la banda de conducción; pero el procedimiento para huecos en la banda de valencia es prácticamente el mismo, y los resultados son idénticos a los que se acaban de dar, substituyendo las masas electrónicas y la constante del potencial de deformación de la banda de conducción por sus equivalentes respectivos de la banda de valencia. De acuerdo con (9.11-20) y (9.11-21), la movilidad debe variar como T- 3 12 y m~- 5 12 cuando la dispersión de la red en modo acústico es la interacción dominante. Si se calcula la relación de la movilidad de electrones a la de huecos, como lo expresa (9.11-21) y su equivalencia para los huecos, se puede demostrar que J.l.n -_ ( mn*/ mp*)- 5/2("::' /"::' )- 2 . -e-., J.l.p

(9.11-22)

Puesto que Zc y Zv son casi siempre más o menos idénticas, con frecuencia se toma como regla práctica que la relación de las movilidades es la relación inversa de las masas efectivas a la potencia f. Desafortunadamente los resultados experimentales concuerdan sólo en parte con las predicciones de (9.11-21). La variación de la movilidad con respecto a la temperatura en el rango de las temperaturas en donde predomina la dispersión de la red, en particular, casi siempre es más fuerte que la variación T- 3 / 2 que se encontró con este análisis. En la tabla 9.4 se indican los valores promedio de la movilidad medida a 300°K (en donde la dispersión de red es la dominante en todas las muestras, excepto las muy impuras) y la variación de la movilidad con relación a la temperatura para huecos y electrones en el germanio y el silicio. En materiales con superficies de energía que son esencialmente esféricas, por ejemplo, Si y Ge tipo p, el efecto de dispersión por vibraciones de la red de modo óptico es importante, sobre todo a temperaturas más altas. 14 13 Véase, por ejemplo, W. Shockley, Electrons and Holes in Semiconductors. Nueva York: D. van Nostrand Inc., (195 Nostrand Inc., (1950) página 539. 14 H. Ehrenerich y A. W. Overhauser, Phys. Rev. 104, 649 (1956).

340 Semiconductores electrónicos uniformes en equilibrio TABLA 9.4. Datos de la movilidad medida para el silicio y el germanio P.•

Si Ge

1600 3800

Variación de JJ.n en función de la temperatura T-z-5 T-1·66

p.,

Variación de llp en función de la temperatura

500 1900

T-1·3 T-1 3

Cuando las superficies de energía son elipsoidales, por ejemplo, en Ge y Si tipo n, los efectos que se originan en la dispersión de electrones de una elipsoide a otra (dispersión entre valles), que no se ha tomado en cuenta en el cálculo anterior, también tiene gran importancia. En este proceso, cuando un electrón se transfiere de una elipsoide a otra, la conservación de la cantidad de movimiento requiere la generación o la absorción de un fonón cuya energía es del mismo orden que la del electrón mismo. Por tanto, estos eventos de dispersión no se pueden considerar como aproximadamente elásticos. Un estudio detallado de este tipo de dispersión. realizado por Herring, 15 demostró que la dependencia de la movilidad que se observó en relación con la temperatura, en Ge y Si tipo n, se puede explicar basándose en la dispersión entre valles aunque, por supuesto, la contribución de modo óptico es importante sin lugar a dudas. Además, el efecto de los modos transversales de vibración es mucho mayor cuando la estructura de la banda es de la forma de "muchos valles",l 6 y, por ende, no se puede omitir por completo para el Ge y el Si tipo n. Se recomienda consultar los excelentes artículos de Herring 15 y Blatt 17 para hacer un estudio más detallado de estas cuestiones. El cálculo del tiempo de relajación para la dispersión de impurezas se basa en la teoría de la dispersión de partículas cargadas mediante el potencial de Coulomb de los núcleos, que originariamente fue desarrrollada por Rutherford para explicar la dispersión de partículas o:. 18 • 19 En un cristal semiconductor que contiene impurezas de substitución y el potencial de Coulomb debido a los iones cargados, donadores y receptores, sirven para desviar las trayectorias de electrones y huecos, al igual que lo hace el potencial de un núcleo pesado que desvía una partícula o: en el experimento de dispersión de Rutherford. Si la sección transversal diferencial a(O) se define en tal forma que a(O) dll, es el área diferencial del haz incidente de partículas que se dispersa a través de un ángulo 9 en un elemento con un ángulo sólido dll, se puede demostrar mediante la mecánica clásica o la cuántica,t9 que

a( O) dO. =

2 1 ( zé* 2 ) --dO.

2Km v0

4

(J

(9.11-23)

sen 2

C. Herring, Bell Syst. Tech. J. 34, 237 (1955). C. S. Smith, Phys. Rev., 94, 42 (1954). F. J. Blatt, Theory of Mobility of Electrons in So lid State Physics, Advances in Research and Applications. Nueva York: Academic Press (1957), Vol. 4. página 199. Véase particuldrmente la página 332 ff. 18 E. Rutherford, Phil. Mag., 21, 669 (1911). 19 R. B. Leighton, Principies of Modem Physics, Nueva York: McGraw-Hill (1959), página 485 ff. 15

lli J7

Mecanismos de dispersión y movilidad de los portadores de carga

341

y que

o

Ze 2 tan-=----. 2 Kam*v~

(9.11-24)

La geometría de dispersión se ilustra en la figura 9.22 para una interacción de Coulomb de repulsión (hueco ion donador) y en la figura 9.23, para una interacción de Coulomb de atracción (electrón e ion donador); las ecuaciones anteriores se aplican a ambos casos. La cantidad K es la constante dieléctrica de la substancia, v0 es la velocidad inicial (y final), y a es el "parámetro de impacto" o la distancia perpendicular entre el centro de dispersión y la proyección de la línea inicial de acercamiento de la partícula. Para una sola partícula incidente, el número de colisiones que puede sufrir por unidad de tiempo en un ángulo sólido dn, claramente es Nv 0 a(O) dQ, en donde N es el número de impurezas de dispersión por unidad de volumen. Puesto que la energía se conserva en la interacción de dispersión, las magnitudes de las cantidades de movimiento inicial y final de la partícula dispersada son las mismas; sin embargo, puesto que la dirección cambia por acción del ángulo de dispersión (), existe un cambio consecuente en la cantidad de movimiento de la componente x en sentido directo de

e

flpx

=

Po(l -

COS

0).

(9.11-25)

Ahora, según (9.11-23), es evidente que casi todas las colisiones producen sólo un pequeño ángulo de deflexión. No obstante, el tiempo de relajación es el lapso que se requiere en promedio para que la velocidad directa de la partícula se reduzca a cero y éste es, obviamente, mucho mayor que el tiempo promedio entre tales eventos de dispersión. En efecto, de acuerdo con (9.11-25), se puede observar que el número efectivo de colisiones que destruyen la velocidad es menor que el número total real de dispersiones, por un factor (1,- cos 0). El número equivalentes de colisiones que destruyen la velocidad por unidad de tiempo, comprendiendo un ángulo de deflexión O en un ángulo sólido dQ no es, por ende, Nv 0 a{O) dQ sino más bien, dnerr

= Nv 0 u(O)(l

- cosO) dO.

= d(l/r).

(9.11-26)

Estado final Trayectoria del hueco

Estado inicial Po Px =Po

Ion de impureza, carga +Ze

Figura 9.22.

La trayectoria de un hueco que se dispersa mediante la interacción de Coulomb con un centro de dispersión fijo de carga + Ze.

342

Semiconductores electrónicos uniformes en equilibrio

a

Figura 9.23.

Trayectoria de un electrón dispersado por un centro fijo de dispersión de carga +Ze.

Esta cantidad es precisamente la recíproca del tiempo de relajación para partículas con esta velocidad inicial específica que sufren colisiones relacionadas con este ángulo de dispersión en particular. El tiempo total de relajación se puede calcular integrando sobre el ángulo sólido y promediando sobre las velocidades. Puesto que la dispersión es independiente del ángulo azimutal


-1) = 2nNv0

-r(vo

f"

(

2 o-(0)(1- cosO) sen OdO= 2nNv 0 2 Ze* 2 ) Bo Km Vo

= -16nNv0 (2

ze*2 2 ) 2 In sen-= (} 0 8nNv 0 (

Km v0

2

Ze*2

2

2Km v0

)

2

2

f" Bo

(1- cosO)esen e dO 4

sen 2

) In [ 1 + ( 2 Km*v~ 2 N 1 ,3 Ze

2

]



(9.11-27) Al efectuar la integración, es mejor expresar todas las funciones trigonométricas de acuerdo con el argumento e12. El límite superior de la integral debe ser e=-¡;_ que corresponde a un "choque directo" que refleja a la partícula incidente de nuevo hacia su trayectoria original. Para una colisión de esta naturaleza, el parámetro de impacto a es cero. El límite inferior sería G = O para un centro de dispersión aislado (que daría origen a una sección tranversal para la dispersión infinita); pero dentro del cristal, la influencia de un centro de dispersión individual se extiende hacia afuera sólo a una distancia del orden del espaciamiento medio entre los iones de dispersión Por tanto, conviene "cortar" la dispersión de un ion en particular cuando el parámetro de impacto a es igual a d/2, en donde d = N- 1 / 3 es la distancia media entre los átomos de impureza. Entonces, el límite inferior de la integral se encuentra en 1 (9.11-28) a= 2N1/3 que, de acuerdo con (9.11-24), corresponde a

(9.11-29)

Mecanismos de dispersión y movilidad de los

portadore~

de carga

343

Los cálculos anteriores permiten expresar a -r(v 0) en la forma (9.11-30)

Ahora es necesario calcular promedios, de acuerdo con el cual,

T

por medio del proceso acostumbrado de los

(9.11-31)

Esta integral no se puede evaluar con prec1s10n por medios analíticos; pero si se observa que el término logarítnúco del denominador sólo varía muy lentamente con respecto a v0 , en comparación con el factor de multiplicación vóe-m*vo 2 12 kT, se puede obtener un valor aproximado suponiendo que el término logarítmico tiene un valor constante que es igual al valor que alcanza cuando el factor de multiplicación es máximo. Se puede asegurar que este valor máximo se obtiene para Vo = .J7kT/m*. Haciendo que v0 sea igual a esta cantidad en el término logarítmico, eliminándolo de la integral y evaluando las integrales restantes de acuerdo con la tabla 5.1, se puede obtener (9.11-32) por lo cual, la movilidad estará dada por (9.11-33) Conwell y Weisskopf11 , 20 desarrollaron originalmente este método de cálculo y (9.11-33) se cita a menudo como la fórmula Conwell-Weisskopf. Brooks y Herring 21 desarrollaron el mismo cálculo de un modo algo más refinado y su resultado es similar, excepto que el término logarítmico que varía con lentitud es algo distinto. Las dependencias en relación con la temperatura y la concentración son idénticas en ambos casos. En el cálculo anterior, el promedio se sacó suponiendo que las superficies de energía eran esféricas. El cálculo para superficies elipsoidales es mucho más complejo y no se efectuará aquí; la magnitud del tiempo de relajación se verá afectada, pero no así las dependencias de la temperatura y la concentración. En

20 Este parece un error en el artículo original de Conwell-Weisskopf que ha persistido en casi todos los estudios de este tema realizados por otros autores. Conwell-Weisskopf indican en su artículo original [su ecuación (18)] que el máximo de la función que multiplica el término logarítmico del integrando en el numerador de (9.11-31) ocurre en v2 =6kT/m, en tanto que basta un simple cálculo para demostrar que en realidad se produce en 7 kT/m. Esto explica el factor 7/2 en el argumento del término logarítmico de (9.11-33) que va en lugar del factor 3, que es el que aparece en la fórmula original de Conwell-Weisskopf. La corrección aplicable al resultado original es obviamente m u y pequeña y no afecta su validez general. 21 H. Brooks, Phys. Rev. 89, 879 (1951).

344

Semiconductores electrónicos uniformes en equilibrio

todo el desarrollo se supuso que los átomos de impurezas estaban completamente ionizados; a temperaturas muy bajas¡ esto no es exacto. En estas circunstancias, se debe considerar que la cantidad N de las ecuaciones anteriores representa la concentración exclusiva de los centros de impureza ionizados, como lo indican (9.5-4) o (9.5-8). Esto introduce una dependencia adicional en relación con la temperatura. pero es importante sólo a temperaturas muy bajas. De acuerdo con la ecuación (9.11-33), cuando domina la dispersión de impurezas ionizadas, se debe encontrar que la movilidad es proporcional a T3 12 y que presenta una dependencia inversa en relación con la concentración de impurezas. Aunque es difícil obtener especímenes en los que la dispersión de impurezas determine solamente la movilidad, estas predicciones se han verificado por la experiencia. cuando menos de un modo aproximado. En la figura 9.24 se ilustra una gráfica de la movilidad en función de la concentración de impureza para el germanio. En concentraciones reducidas de impurezas, la interacción de dispelSión dominante es la de la red, es independiente del contenido de impureza, y por tanto la movilidad [como se da, por ejemplo, en (9.11-21)], también es independiente de la densidad de impurezas. A altas concentraciones de átomos de impurezas, la dispersión de impurezas ionizadas se convierte. en el proceso de dispersión más importante y la movilidad decrece al incrementarse la densidad de impurezas, como lo predice la fórmula Conwell-Weisskopf, (9.11-33). En el rango intermedio las interacciones de dispersión de ambos tipos son importantes y la movilidad 1J. debe expresarse como IJ- 1 = IJ.11 + IJ/1 en donde IJ.¡ es la movilidad que puede atribuirse sólo a la dispersión de impurezas ionizadas y IJ.¡ la que se puede encontrar en los casos en que la dispersión de la red es el único proceso importante. Además de la dispersión de la red y la de impurezas, hay otras interacciones de dispersión que tienen una importancia ocasional. Los centros de impurezas neutras, al igual que los ionizados, pueden producir una dispersión apreciable, si existen en cantidades suficientes. Erginsoy 2 2 realizó un estudio de este tema. Se ha descubierto que la dispersión de impurezas neutras es independiente de la temperatura y. por tanto, puede tener importancia a temperaturas muy bajas cuando la dispersión de la red es despreciable y la mayoría de las impurezas no están ionizadas. Es más. las vacantes, átomos intersticiales, dislocaciones, fronteras de grano y las superficies de la muestra pueden dispersar huecos y electrones aunque, en muchos casos, la

¡.<¡

4000

------------

3000 2000 1000

10 20

IC 19

1018

10 17

10 16

10 1 ~

10 14

10 13

Densidad de donadores Nd (Germanio tipo n, 300°K) Figura 9.24.

22

Efecto de la concentración de impurezas en la movilidad de los electrones, a la temperatura ambiente, en el germanio tipo n, de acuerdo con la teoría ConwellWeisskopf de la dispersión de impurezas. [Tomado de E. M. Conwell, Proc. I.R.E., 40: 1327 (1952).]

C. Erginsoy, Phys. Rev., 79, 1013 (1950).

Mecanismos de dispersión y movilidad de los portadores de carga

345

dispersión atribuible a estos medios se desecha en comparación con la dispersión de red o impurezas. La exposición del comportamiento volumétrico de semiconductores dada en este capítulo de ningún modo es completa. En realidad, no se han tratado las propiedades térmicas y ópticas en absoluto y, por falta de espacio, ha sido necesario omitir una explicación de los efectos sumamente interesantes que se pueden observar en semiconductores sometidos a esfuerzos hidrostáticos o uniaxiales. 23 No obstante, se espera que este estudio haya aclarado los campos muy básicos e importantes y haya desarrollado métodos de utilidad general en la investigación de algunos de los temas que no se han visto en detalle.

EJERCICIOS l. En papel semilogarítmico, haga las gráficas de la concentración de los portadores intrínsecos n¡ en función de 1/T para (a) germanio, (b) silicio, (e) InSb (LlE=0.22 eV, m;!; =0.013 m 0 , mp = 0.18 mo), (d) GaAs (Á€= 1.5 eV, m~= 0.1 m 0 , mp = 0.4 m 0 ). Asegúrese de que las gráficas indiquen con claridad la variación de n¡ en función de T sobre el rango comprendido entre 10° y 500°K. 2. Estudie un semiconductor intrínseco bidimensional en el que, al igual que en los sistemas metálicos bidimensionales, las funciones de densidad de estados son

e> ec g(e) =O

e.< e< ec

g.(e) de= (41Tm: /h 2 ) de

e< e.

Demuestre, utilizando sólo la estadística de Fermi y sin recurrir a la aproximación de Boltzmann, que para el caso en que mp/m~ = 2, la posición del nivel de Fermi se puede expresar como

1

ec- ef

=

2 !le-

kT

en donde ~ =

~

8

-zln 3 + kTin cos 3'

32

]1/2

tan- 1 [ 27 (r"''n)- 1

3. Haga las gráficas de la conductividad para el germanio tii?o p y n en función de la concentración neta de impurezas J/'!.d- Ngl para valores de INd- N0 1 que van de O a 10 1 'cm- 3 a las siguientes temperaturas: 80 K, 300 K, 500°K. Suponga que J.l.n varía como r- 1 •65 Y f.lp como r- 3 ·2 . Haga estas gráficas en papel logarítmico. 4. ¿Para qué valores de concentración de portadores n 0 , Po es mínima la conductividad de un semiconductor? ¿Cuál es el valor del contemdo neto de impurezas ¡Nd- N 0 i que esto implica? 5. Para un semiconductor con superficies de energía esféricas tanto en la banda de conducción como en la de valencia, pero con dos especies de huecos, demuestre que el coeficiente de Hall de campo pequeño se puede escribir como sigue

23 R. W. Keyes, "The Effects of Elast1c Deformation on the Electrical Conductivity of Semiconductors." en Salid State Physics, Advances in Research and Applications. Nueva-York: Academic Press (1960), Vol. 11, página 149.

346 Semiconductores electrónicos uniformes en equilibrio en .do~de Pot. p 02 son las .concentraciones, 1Jp 1 , 1Jp2 las movilidades y Tp 1, Tp 2 los tiempos de relajac!On para las dos especies de huecos. 6. Para cada una de las superficies de energía constante del germanio, encuentre los tensores individuales de conductividad a~'J relacionados con los ejes cúbicos como ejes de coordenadas. En el germanio, las superficies de energía constante son cuatro elipsoides cuyos ejes principales caen a lo largo de las cuatro direcciones (111). Demuestre que el resultado (9.10-23) se obtiene sumando totalmente las elipsoides. 7. Demuestre que si el campo estático está en la dirección [100]. sólo se observará un pico de resonl!-ncia de ciclotr~n a la frecuencia w = ~eJ!/c)[(mf¡ +?ml>!}mfiml2 1I¡2 en el germanio. ~Qué resonancias Se observanan COn el campo estat!CO en fa dueCCIOn r111 l7 8. Con las leyes de la mecánica clásica, derive la fórmula de dispersión de Rutherford (9.11-23) y la relación asociada (9.11-24). 9. Se ha determinado que un espécim de semiconductor tiene una resistividad de 12.5 ohm-cm. El espécimen tiene 1 cm de longitud, por 5 mm de ancho y 1 mm de grosor. Se hace fluir una corriente de 1 mA a lo largo de la dimensión más larga de la muestra y se mide un voltaje de Hall de 5 m V en la anchura de 5 mm de la muestra, cuando se usa un campo magnético de 2000 gauss. ¿Cuál es la concentración de portadores y la movilidad de Hall de los portadores en la muestra? Se puede suponer que la muestra es extrínseca, que las superficies de .:nergías son esféricas y que la dispersión acústica de modo acústico es el proceso de dispersión dominante. 10. Escriba los detalles relacionados con la maximización de la expresión (9.5-2) por el método de los multiplicadores lagrangeanos, completando así la derivación en (9.5-3). 11. Demuestre que (9.3-6) y (9.3-15) se pueden transformar de tal modo que indiquen

12. Explique físicamente las características principales de las curvas experimentales ilustradas en la figura 9.13, y analice las relaciones entre las tres gráficas separadas.

LECTURAS RECOMENDADAS A. C. Beer, "Galvanomagnetic Effects in Semiconductors"; suplemento 4 en So/id State Physics. Advances in Research and Applications, Academic Press., Inc., Nueva York (1963). F. J. Blatt, "Theory of Mobility of Electrons in Solids," en So/id State Physics, Advances in Research and App/ications, Vol. 4, Academic Press., Inc., Nueva York (1957). H. Brooks, "Theory of the Electrical Properties of Germanium and Silicon," en Advances in Electronics and Electron Physics, Vol. 7, Academic Press, Inc., Nueva York (1955). E. Burstein y P. H. Egli, "The Physics of Semiconductor Materials," en Advances in Electronics and Electron Physics, Vol. 7, Academic Press., Inc., Nueva York (1955). H. Y. Fan, "Valence Semiconductors, Germanium and Silicon," en So/id State Physics, Advances in Research and Applications, Vol. 1, Academic Press., Inc., Nueva York (1955). R. W. Keyes, "The Effect of Elastic Deformation on the Electrical Conductivity of Semiconductors," en Salid State Physics, Advances in Research and Applications, Vol. 11, Academic Press, Inc., Nueva York (1960). W. Shockley, Electrons and Hales in Semiconductors, D. van Nostrand Co., lnc., Nueva York (1950). R. A. Smith, Semiconductors, Cambridge University Press, Nueva York (1961).

cAPITuwlO Exceso de portadores en semiconductores 10.1

INTRODUCCION

En un metal prácticamente es imposible alterar la concentración volumétrica de los portadores de carga libres. Se puede introducir un exceso de portadores; pero sólo induciendo una carga eléctrica en el espécimen. En estas condiciones, la densidad de carga en exceso reside esencialmente en la superficie del metal y no se afecta la concentración volumétrica de los portadores de carga. En esta situación no se observa ningún cambio en las propiedades volumétricas de transporte. Sin embargo, en un semiconductor se puede alterar profundamente la concentración de portadores de carga en el material sin introducir ninguna densidad de carga eléctnca importante. Esto se logra gracias a que pueden tenerse simultáneamente dos tipos de portadores de carga, huecos y electrones; si los huecos y los electrones en exceso se introducen en pares, se pueden crear grandes desviaciones de los valores de equilibrio térmico de la concentración volumétrica de portadores sin que se forme ninguna densidad de carga neta. La formación de estas densidades de portadores en exceso del nivel de equilibrio va acompañada de una modulación notable de la conductividad volumétrica del material, como lo establece {9.7-6). Esta posibilidad es la que permite el uso de elementos semiconductores como dispositivos electrónicos tales como rectificadores, transistores y unidades de conmutm:ión. Si se extraen huecos y electrones en pares, se pueden obtener concentraciones volumétricas de portadores inferiores a los valores de equilibrio, con la misma facilidad con que se crean concentraciones en exceso mediante la introducción o inyección de pares de portadores de carga. 11, absorbe. Por tanto, el espectro de absorción de un semiconductor se caracteriza siempre por un cambio muy rápido Los portadores excedentes se pueden crear en los semiconductores iluminando el material con una frecuencia tal que la energía del fotón hwo sea igual o sobrepase a la energía de la banda prohibida ~€. En estas condiciones, los fotones incidentes tienen la suficiente energía para romper los enlaces covalentes de la red de pares de electrones, liberando electrones libres y dejando los huecos en los sitios de excitación. Los electrones y los huecos en exceso que se crean de esta manera en pares, contribuyen a la conductividad del cristal, que luego se incrementa bajo la iluminación, siendo el aumento proporcional a la intensidad de la luz. Este fenómeno se denomina fotoconductividad y es muy característico de todos los semiconductores. Puesto que en la creación de cada par electrón-hueco se absorbe un fotón, la luz con una longitud de onda lo suficientemente corta para que la energía del fotón sobrepase ~€, se absorberá con mucha fuerza dentro del cristal. Por otra 347

348

Exceso de portadores en semiconductores

Coeficiente de absorción


(t)

Borde de absorción (hw 0 : Ó<)

a

~~x, Opaco

1

Transparente

~----------~.r¡------•X

Tiempo

1-- Luz ---l

Obscuro

(o) Figura 10.1.

Obscuro

(w>w 0 )

(b)

(a) Espectro de absorción de un semiconductor típico cerca del borde de absorción fundamental. (b) Respuesta fotoconductiva de un cristal semiconductor a una luz con una longitud de onda lo suficientemente corta para excitar pares electrónhueco en exceso.

parte, la luz con una longitud de onda mayor, cuya energía de fotón es inferior a ~e, no puede crear pares electrón-hueco y raramente se absorbe. Por tanto, el espectro de absorción de un semiconductor se caracteriza siempre por un cambio muy rápido en el coeficiente de absorción, a una longitud de onda que corresponde a la energía del fotón ~e, teniendo el cristal una mayor fuerza de absorción para longitudes de onda más corta y siendo casi transparente para longitudes de onda más largas, como se ilustra en la figura lO.l(a). La región de transición brusca de la opacidad a la transparencia se denomina borde de absorción. En el germanio, el borde de absorción se produce en el infrarrojo cercano a aproximadamente X = 1.75 Jl., correspondiendo a ~€ = 0.7 eV, y en el silicio, a alrededor de 1.13 Jl., correspondiendo a ~e= 1.12 eV. La banda de energía prohibida ~e se puede determinar con precisión en el espectro de absorción, midiendo la longitud de onda a la que se produce el borde de absorción. En la figura 1O.l(b) se muestra la respuesta fotoconductiva de un semiconductor a la luz con una longitud de onda lo suficientemente corta para crear pares electrón-hueco. Los portadores excedentes también se pueden crear en cristales semiconductores por medio de haces de partículas de alta energía (electrones, protones, partículas a), rayos X, radiación 'Y y mediante contactos metal-semiconductor debidamente polarizados o uniones p-n. Volveremos sobre estos conceptos más adelante.

10.2

COMPORTAMIENTO DEL TRANSPORTE DE LOS PORTADORES EXCEDENTES; LAS ECUACIONES DE CONTINUIDAD

En cualquier cristal semiconductor, continuamente se generan pares electrón· hueco por medios térmicos o de otra índole, y se están recombinando de un modo continuo. En equilibrio térmico, el único proceso de generación es el térmico. La velocidad a la que se generan los pares y a la que se recombinan debe ser idéntica: de otra manera, la concentración de electrones. y huecos crecería o declinaría como una función del tiempo. La velocidad de generación térmica de equilibrio g 0 ( cm- 3 seg- 1 ) es el número de pares electrón-hueco generados por unidad de volumen en unidad de tiempo, mediante la ruptura térmica de enlaces covalentes. Esta

Comportamiento del transporte

349

cantidad es una función de la temperatura y ciertos parámetros del cristal; pero es independiente de la concentración de electrones y huecos. La velocidad de recombinación se relaciona con el tiempo medio que transcurre entre la generación de un electrón o un hueco y su recombinación subsecuente. Esta cantidad se conoce como tiempo medio de vida del portador. Si sólo se tuviera un portador de una especie dada por unidad de volumen del cristal, en cualquier tiempo en particular, el número de sucesos de recombinación por unidad de volumen por segundo de este tipo de portador sería 1/r, en donde T es el tiempo de vida de dicha especie de portadores.1 Cuando se tienen n portadores por unidad de volumen, la velocidad de recombinación (número de eventos de recombinación por unidad de volumen por unidad de tiempo) es n veces mayor, es decir, n/r. En las condiciones de equilibrio térmico, la concentración de electrones es n 0 y la concentración de huecos es p 0 y, puesto que las velocidades de generación y recombinación de huecos y electrones deben ser iguales en estas circunstancias, es obvio que y

(10.2-1)

en donde g 0 n y g 0 P son las velocidades de generac10n térmica en equilibrio para electrones y huecos, respectivamente, y en donde T no y T po son los tiempos de vida promedio para las especies de portadores respectivas en la situación de equilibrio. Además, puesto que la generación térmica siempre da como resultado la producción de pares electrón-hueco, se está generando un hueco por cada electrón y g0 n y g0 p deben ser iguales, de donde,

(10.2-2) La igualdad de las velocidades de generación y recombinación se aplica a todos los sistemas de estado estacionario, aun los que no están en equilibrio térmico. La igualdad de las velocidades de generación de electrones y huecos, así como la igualdad de las velocidades de recombinación de electrones y huecos, deben conservarse también en sistemas que no se encuentran en la situación del estado estacionario, ya que la generación (o recombinación) de un electrón va acompafíada inevitablemente de una generación (o recombinación) de un hueco. No obstante, en sistemas que no tienen un estado estaeionario, las velocidades de generación y recombinación para electrones (o huecos) pueden ser diferentes. En todo caso, es necesario escribir siempre y

(10.2-3)

en donde gn y gP son las velocidades reales de generación, n y p las concentraciones locales y ·r n y T P el tiempo de vida de electrones y huecos, respectivamente. En

1 Hasta ahora se han usado los símbolos T n• T P y T para representar los tiempos de relajación asociados con procesos de dispersión. Sin embargo, los mi;;mos símbolos se usan universalmente en las obras impresas para representar también los tiempos de vida de recombinación. Puesto que esta práctica ha quedado justificada por los numerosos años de uso y, dado que no se desea adoptar una notación muy compleja, se usarán los mismos símbolos para los dos grupos de cantidades. No obstante, de aquí en adelante se dará por sentado que T, Tn y T P se refieren siempre a los tiempos de vida de recombinación, a menos que se especifique otra cosa.

350 Exceso de portadores en semiconductores

x+dx

X

Figura 10.2.

Flujo de portadores que entran y salen de un pequeño elemento de volumen del cristal.

estas ecuaciones, las velocidades de generac10n gn y gP, al igual que las concentraciones n y p, y los tiempos de vida r n y T P, deben considerarse generalmente como funciones de las coordenadas de espacio y tiempo, dentro del cristal. Ahora se verá una región del cristal cuyas dimensiones son dx, dy, dz, como se indica en la figura 10.2. Supóngase que hay unas densidades de flujo de partículas JP y Jn de huecos y electrones, respectivamente, que fluyen dentro y fuera de esta región. La componente x de J P en x + dx se puede expresar en función de J P en x, haciendo una expansión de Taylor de lpx(x + dx); en el límite en donde dx se hace pequeña, sólo los dos primeros términos son importantes, de donde, ()Jpx

JPix + dx) = JPx(x) + ox dx.

(10.2-4)

El incremento neto en el número de huecos dentro de la región, por unidad de tiempo, originados en una diferencia en las componentes x de JP en las dos caras ABCD y EFGH, entonces es

[Jpix)- Jpx(x

+ dx)] dy dz =

a:

oJ

dx dy dz.

(10.2-5)

También se tendrán términos similares que se originan en la diferencia de las componentes y de JP en las caras ACGE y BDHF, y en la diferencia de las componentes z de JP en ABFE y CDHG. El incremento neto total por unidad de tiempo en el número de huecos dentro de la región, que se origina debido a estos términos es - V • JP dx dy dz. Si los procesos de generación y recombinación son activos dentro del volumen, habrá gp dx dy dz huecos generados y (pjr P) dx dy dz que se pierden por recombinación por unidad de tiempo dentro de la región de interés. La suma algebraica de todas estas cantidades representa el incremento neto total del número de huecos dentro del volumen dx dy dz por unidad de tiempo que es, evidentemente, (opjot) dx dy dz. Si se saca la suma algebraica de las diferentes contribuciones, se iguala a (opfot) dx dy dz y se anula el elemento de volumen en ambos lados de la ecuación, se puede demostrar que P

op

-V·J P +g p - =Ot -' t" p

(10.2-6)

Comportamiento del transporte

351

mientras que con un cálculo similar para los electrones dentro del mismo elemento de volumen, se obtendrá -V ' Jn

+ Un -

n

on

- = -0 • t

'n

(10.2-7)

Las expresiones ( 10.2-6) y ( 10.2-7) se citan como las ecuaciones de continuidad para los electrones y los huecos. En condiciones apropiadas de frontera, las soluciones de estas ecuaciones describen la distribución de la concentración de electrones y huecos en función de las coordenadas del espacio y el tiempo, y proporcionan una descripción completa del comportamiento de transporte de electrones y huecos dentro del semiconductor en condiciones que no sean las de equilibrio. Para llegar a soluciones explícitas de las ecuaciones de continuidad, es necesario expresar la corriente en función de la concentración. Esto se logra escribiendo la densidad del flujo de partículas como la suma de una densidad de flujo de difusión y una densidad de corriente de arrastre producida por cualquier campo eléctrico que pueda estar presente. En consecuencia, se puede escribir (10.2-8) y

(10.2-9) El origen de la componente de corriente debida al campo, en las ecuaciones anteriores, queda perfectamente en claro. 2 El término de difusión establece que siempre que exista un gradiente de concentración Vp, se tendrá un flujo neto de corriente de partículas de las regiones de alta concentración a las de baja concentración, proporcional al gradiente de la concentración en cualquier punto. Este flujo de difusión es análogo al flujo de calor en presencia de un gradiente de temperatura. La constante de proporcionalidad se denomina coeficiente de difusión o difusibilidad. Se puede demostrar rigurosamente que la componente de difusión de la corriente debe tener esta forma, aplicando los métodos desarrollados en el capítulo 7, principiando con la ecuación de Boltzmann y suponiendo la aproximación del tiempo de relajación (7.24). No se incluirá aquí la reproducción de los detalles de esta demostración, sino que se asignarán como un ejercicio para el lector, lo cual constituye una buena práctica en el uso de la teoría del transporte que se vio con anterioridad. Cuando la trayectoria libre media es independiente de la velocidad, que es una aproximación aceptable en los semiconductores, en donde la dispersión de red es el proceso dominante, resulta que los coeficientes de difusión de los electrones y los huecos se pueden expresar como y

(10.2-10)

en donde "-n y Ap son las trayectorias libres medias del electrón y el hueco, y en y son las velocidades térmicas medias de los electrones y los huecos, respectivamente. En las circunstancias en que ( 10.2-10) es válida, las trayectorias libres medias

cP

2 En (10.2-8) y (10.2-9) se supone que no hay campos magnéticos presentes o cuando menos, que, su efecto en los portadores es pequeño en comparación con el del campo eléctrico. Los símbolos ln y Jp se usarán para representar la densidad de flujo de partícula en tanto que In(=- eJn) y lp(= eJp) se usarán para la densidad de la corriente eléctrica.

352

Exceso de portadores en semiconductores

y los tiempos de relajación de electrones y huecos están relacionados por medio de (7 .3-18). Si las ecuaciones (10.2-10) se expresan en función de los tiempos de relajación, y si las velocidades térmicas se representan por (5.4-20), con el uso de las masas efectivas apropiadas, se puede demostrar fácilmente, utilizando (7.3-13), que los coeficientes de difusión se pueden representar de acuerdo con las movilidades como sigue p.PkT

D =--.

y

(10.2-1!)

e

P

Estas relaciones entre los coeficientes de difusión y las movilidades se conocen como relaciones de Einstein. Aunque se derivaron antes basándose en suposiciones muy restrictivas, se puede demostrar que se aplican a todos los sistemas que obedecen a la estadística de Boltzmann. En realidad, si se incluye una constante numérica apropiada, se puede demostrar que se aplican también a los sistemas de Fermi. Si las ecuaciones de la corriente ( 10.2-8) y ( 10.2-9) se substituyen en las ecuaciones de continuidad (10.2-6) y (10.2-7), esta última se puede escribir como DpV2 p - p. pV • (pE)

+ gp -

p iJp - = -iJt

(10.2-l2J

't p

y DnV 2 n

n

iJn

+ p.nV· (nE) + gn - =ot -. ..,

(10.2-13)

Los términos de divergencia en las ecuaciones anteriores se pueden transformar a una forma más manejable utilizando la identidad vectorial

V· (
+
(10.2-14)

que es aplicable a cualquier vector A y cualquier función escalar 1/J. De igual manera, conviene expresar las velocidades de generación como la suma de la velocidad de generación térmica, más la velocidad a la que se generan los portadores en exceso de la velocidad de generación térmica, de donde, g, = gon

+ g~

y

gp

= gOp + g~,

(10.2-15)

en donde g~ y g~ son las velocidades de generación del exceso. Las velocidades de generación térmica pueden expresarse ahora en función de las concentraciones en equilibrio y los tiempos de vida por medio de (10.2-l). Después de efectuar estas transformaciones, las ecuaciones de continuidad (10.2-12) y (10.2-13) toman la forma (10.2-16)

D,V 2 n + p.,(E • Vn

+ nV • E) + g~ -

( -n - -n 0

-r,.

-r,.o

)

iJn = -. iJt

(10.2-17)

El campo E se puede expresar como la suma del campo aplicado y el campo interno que se origina por el hecho de que las partículas en difusión están cargadas, por lo cual,

E = E;nt + Eap.

(10.2-18)

Comportamiento del transporte

353

Concentración

-

Etnt

t=o l>o

-x

(e)

(a)

Figura 10.3.

Etapas sucesivas en la dispersión difusiva de una distribución de pru:es electrónhueco en exceso, que inicialmente tiene la forma de una función 8 en un semiconductor intrínseco.

El campo interno tiene su origen en el hecho de que las trayectorias libres :nedias (y, por ende, los coeficientes de difusión) de los electrones y los huecos pueden ser diferentes. Si los electrones y los huecos pudieran moverse por completo de un modo independiente entre sí, las especies de difusión más rápida tenderían a adelantarse a las especies de difusión más lenta, dejando a estas últimas totalmente detrás. Sin embargo, ya que las partículas de difusión están cargadas, cuando esto sucede en realidad, comienza a producirse una separación de las cargas positivas y negativas, se establece un campo eléctrico interno que tiende a retardar a las partículas de difusión rápida y a impulsar a las más lentas. Este es el campo Eint de la ecuación (10.2-7). Finalmente, este campo se hace lo suficientemente fuerte para contrarrestar por completo cualquier tendencia de las distribuciones de carga positivas y negativas a separarse más todavía; entonces, las distribuciones de partículas positivas y negativas se difunden juntas y el coeficiente de difusión efectiva es mayor que el de las especies de difusión más lenta, pero menor que el del tipo de difusión más rápido. Este fenómeno, denominado difusión ambipolar, se ilustra en la figura 10.3. Como se verá en seguida, un efecto similar altera el carácter del movimiento de arrastre que se produce cuando existe un campo eléctrico aplicado. En las ecuaciones (10.2-16) y (10.2-17), es evidente, de acuerdo con la exposición anterior, que en realidad contienen tres cantidades desconocidas, n, p y E. Para encontrar estas cantidades, es necesario recurrir a otra ecuación. El conjunto de ecuaciones se puede completar escribiendo la expresión de Poisson que relaciona el campo eléctrico y la densidad neta de carga e(p - n + Nd -Na+ Pa - nd ). De acuerdo con esto, V. E= 4np K

= 4ne(p- n + N 4 - Na+ Pa- n4) K

(10.2-19)

en donde K es la constante dieléctrica. Debe hacerse notar que, puesto que el campo aplicado Eap no tiene fuentes o pozos internos, su divergencia es cero, por lo cual, de acuerdo con (10.2-18)

V· E= V· E;nt·

(10.2-20)

Las ecuaciones (10.2-16), (10.2-17) y (10.2-19) forman ahora un conjunto de tres ecuaciones que en principio, pueden resolverse para las tres incógnitas n, p y Eint· Desafortunadamente parece no existir un medio para llegar a una solución de estas tres ecuaciones de una manera analítica directa. Por tanto, es necesario hacer

354

Exceso de portadores en semiconductores

una aproximación física razonable que permita llegar a una solución que, aunque no sea exacta, sea adecuada para la mayoría de los casos de importancia práctica. La aproximación que se utilizará con este fin es la condición de neutralidad eléctrica o la suposición de balance de carga. Se supondrá en (10.2-16) y (10.2-17) que la densidad de electrones en exceso ón = n- n 0 se equilibra mediante una densidad de huecos en exceso óp = p- Po. Es evidente que esto no es del todo cont:cto, porque entonces, jamás se podría establecer un campo interno, y es este campo interno, originado en la disparidad básica de las trayectorias libres medias de electrones y huecos, el que tiende a conservar unidas las distribuciones de densidad de electrones y huecos de difusión. N o obstante, esta pequeña diferencia entre la densidad de electrones y huecos (en comparación con las densidades de excesos de portadores propiamente dichas) es lo que se requiere normalmente para crear este campo interno. La aproximación del equilibrio de carga es casi siempre apropiada en lo que respecta a las densidades de portadores de las ecuaciones ( l 0.2-16) y (1 0.2-17). Sin embargo, no es de esperarse que se use la suposición de neutralidad de carga en (10.2-19). Al contrario, se puede calcular el campo Eint a partir de (10.2-16) y (1 0.2-17) empleando la suposición de neutralidad de carga, ya que entonces se tendrán sólo dos incógnitas, óp y E¡n t' en estas ecuaciones. Este valor calculado de Eint se puede utilizar en (10.2-19) para determinar la densidad de la fuente (y, por tanto, la disparidad en las densidades de electrones y huecos) requerida para mantener el campo. Si la densidad de la fuente calculada es sólo una fracción pequeña de las densidades de electrones y huecos en exceso calculadas en (1 0.2-16) y (1 0.2-17), se puede tener la seguridad de la consistencia de los cálculos y la validez de las suposiciones en las que se basan; de otra manera, será necesario llegar a la conclusión de que los resultados no concuerdan con las hipótesis originales y los cálculos están equivocados. Más tarde se verá que el primer caso es el que se encuentra casi siempre en la práctica real. 3 Por tanto, siguiendo esta línea de razonamiento, se supondrá inicialmente que (10.2-21)

bn = n- n 0 = p- Po= bp.

Este estudio se limitará a muestras homogéneas, en donde la densidad de impurezas es uniforme en todo el material. Para tales muestras, n 0 y p 0 son constantes y los gradientes y las derivadas del tiempo para n y p son iguales a los gradientes y a las derivadas del tiempo de ón y óp, respectivamente. De igual manera, de acuerdo con (10.2-3), se ve claramente que los términos de generación y recombinación de (10.2-12) son iguales a los de (10.2-13). Los términos de generación y recombinación de (10.2-16), que se originan directamente de los términos correspondientes de (10.2-12) son iguales a los términos de generación y recombinación de (10.2-17) que se originan en la misma forma que los términos de (10.2-13). Si se emplean estos resultados en (10.2-16) y (10.2-17), se puede demostrar que

DPV 2 (bp)- J.lp(E. V(bp)

+ pV. E)+ g'-

o(bp) (Po+'P bp - Po) - = -O(

(10.2-22)

!Po

2

D"V (bp)

• + J.ln(E • V(i5p) + nV ·E) +.g'-

(Po +bp - Po) o(bp) - =Tp

!Po

O(

(10.2-23)

3 W. van Roosbroeck fue el primero en adoptar esta línea de planteamiento para el caso del semiconductor [Phys. Rev., 91, 282 (1953)]; pero mucho antes se utilizaron métodos similares para resolver problemas relacionados con el transporte de electrones e iones en descarga~ gdseosas, que son muy similares.

Comportamiento del transporte

355

en donde (10.2-24) El término que comprende V • E se puede eliminar multiplicando (1 0.2-22) por nJJ.n, (1 0.2-23) por PJJ.p y sumando las dos ecuaciones (observando en (1 0.2-21) que n - p = n 0 - Po) para obtener

npnDp + PJ1pDn V2(bp) _ llnJ1p{no- Po) E. V(bp) + g' _(Po+ bp _Po)= iJ(bp). nJln + PJlp nJ1n - Pllp 7: p 7: PO iJt (10.2-25) Ahora, en el coeficiente del primer término anterior, las movilidades se pueden expresar en función de los coeficientes de difusión mediante las relaciones de Einstein (10.2-11). Por tanto, la ecuación (10.2-25) se puede escribir como sigue

D*V 2 (bp)- 11*E • V(bp)

+ g'

bp iJ(bp) -- = -r iJt

(10.2-26)

en donde

D* = ( n + p )D .D P = -,---(_n-'-0-=-+~P_o_+_2.,-b_p_)D_n-::-D~P:-=nDn + pDP (no+ bp)Dn +(Po+ bp)Dp

(10.2-27)

(10.2-28)

y en donde

T

es un "tiempo de vida del portador en exceso" definido por

bp

Po + bp

Po

n 0 + bp

n0

(10.2-29)

7:

La concentración en exceso de las otras especies de portadores, on, es por supuesto igual a op de acuerdo con la suposición del balance de carga (10.2-21). La expresión ( 10.2-26) es la ecuación de transporte ambipolar que obedecen la densidad de electrones y huecos en exceso. 4 El coeficiente de difusión ambipolar D* y la movilidad ambipolar p*, de acuerdo con (1 0.2-27) y (10.2-28) en general, son dependientes de la concentración op de portadores en exceso. Es imposible resolver (10.2-26) en estas circunstancias y casi siempre se debe proceder a partir de este punto, a usar métodos numéricos o de aproximación. No obstante, si la densidad de portadores en exceso op es mucho menor que la mayor de las dos cantidades (n 0 , p 0 ), D* y p* son substancialmente constantes y se pueden obtener fácilmente soluciones analíticas para (10.2-26). Este estudio se restringirá al análisis de situaciones en que se satisface esta condición y ésta se denominará el caso de nivel bajo.

4 Esta ecuación se parece a la de \:Ontinuidad para partículas que se difunden de un modo mdependiente, que tendría la forma (10.2-13); pero no es exactamente la misma, ya que el término E· \1p substituye a \1 ·(pE). Si el campo es constante, los términos son iguales; pero, de otra manera, las ecuaciones y sus soluciones serán diferentes.

356

Exceso de portadores en semiconductores

Ahora se verá el caso de un material fuertemente extrínseco tipo n, en donde n 0 >Po o 6p. Por ejemplo, supóngase que se tienen 10 15 electrones y 1011 huecos por cm 3 en equilibrio. Se tendrá un tiempo de vida de electrones en equilibrio T no y un tiempo de vida de huecos en equilibrio T po que estarán relacionados por (10.2-2) ó (10.2-3). Es obvio que T po es mucho más pequeño (por un factor de 1O" en este caso) que T n 0 • Supóngase ahora que se crea una densidad uniforme de pares electrón-hueco en exceso de tal modo que 6p = 6n = 10 11 cm- 3 • La caneentracción de electrones ahora es n0 + 6n = 1.0001 x 10 15 cm- 3 , con un .incremento del 0.01 por ciento sobre la densidad de equilibrio, en tanto que la concentración de los huecos es 2 x 10 11 , que es el doble de la densidad de equilibrio. Puesto que la densidad de electrones relativa a la densidad de equilibrio prácticamente no se altera la probabilidad por unidad de tiempo de que un hueco dado se encontrará con un electrón casi no varía tampoco. En consecuencia, el tiempo de vida del hueco no se afecta y será prácticamente independiente de 6p para valores pequeños como estos de 6p. Por otra parte, puesto que la densidad de los huecos se ha duplicado, la probabilidad de que cualquier electrón dado se encuentre con un hueco se ha duplicado también, y el tiempo de vida del electrón se reducirá más o menos a la mitad de lo que era en el estado de equilibrio. De donde, el tiempo de vida de electrones debe variar rápidamente con 6p aun a pesar de, que dicha cantidad sea muy pequeña. Evidentemente, la situación será justamente la opuesta en un material tipo p sumamente extrínseco. En general, se observa que el tiempo de vida de los portadores minoritarios es fundamentalmente independiente de 6p para valores pequeños de 6p, en tanto que el tiempo de vida de los portadores mayoritarios no lo es. En un semiconductor de fuerte tipo n, T P = r P para 6p <no, y el tiempo de vida de los portadores en exceso r, como lo define (~0.2-29) se reduce a (10.2-30)

(material de fuerte tipo-n)

De la misma manera, para un cristal tipo p fuertemente extrínseco, se ve claramente que ( 10.2-29) se reduce a (10.2-31)

(matenat de fuerte tipo-p)

Luego para el caso de nivel bajo, el tiempo de vida de los portadores en exceso T se reduce simplemente al tiempo de vida de los portadores minoritarios. Los términos tiempo de vida de portadores en exceso y tiempo de vida de portadores minoritarios se usan con frecuencia indiferentemente, a pesar de que no siempre son iguales. En especial, cuando las condiciones del caso de nivel bajo no se satisfacen o cuando el cristal es casi intrínseco, el tiempo de vida de los portadores en exceso T difiere del tiempo de vida de los portadores minoritarios. Este tiempo de vida de los portadores en exceso es el que se mide casi siempre en los experimentos diseñados para detectar la fotoconductividad de los portadores en exceso. En las condiciones de nivel bajo, (1 0.2-27) y ( 10.2-28) muestran que en el caso de un semiconductor tipo n fuertemente extrínseco, D* y p* se reducen a Dp y llp y que, para un material tipo p fuertemente extrínseco, D* y p* se reducen a Dn Y lln· Si se combinan estos resultados con los expresados en (10.2-30) y (10.2-31), se puede escribir la siguiente expresión para las muestras extrínsecas tipo n D V 2(t5p)- p. E· V(bp) P

p

bp

+ g ' -T Po -

c(t5p) O(

= --

(no~

p0 ,t5p) (10.2-32)

Comportamiento del transporte

3S7

y para muestras extrínsecas tipo p (p 0

~

n0 ,<5n). (10.2-33)

En cualquier caso, la concentración de la otra especie se obtiene de la relación = 8n. Estas ecuaciones son muy parecidas a las de continuidad para el flujo de portadores minoritarios. Los parámetros de transporte y recombinación, en todos los casos, son los de los portadores minoritarios. A menudo se dice que en la situación anterior, se escribe y resuelve la ecuación para los portadores minoritarios de flujo de difusión, aunque esto no es cierto en realidad: las t::cuaciones (10.2-32) y (10.2-33) además contienen una suposición implícita relacionada con el comportamiento de los portadores mayoritarios. En una muestra para la que n 0 y Po no son muy diferentes y en donde 8p es mucho menor que el valor más pequeño de (n 0 , p 0 ), los coeficientes de transporte ambipolar, (10.2-27) y (10.2-28), son constantes y se puede expresar como

8p

D* =(no + Po)DnDp = (p~ + nf)DnDp n 0 Dn + p0 DP nfDn + p~DP

(10.2-34)

y

(10.2-35)

El coeficiente de difusión ambipolar se acerca a Dp para p 0 ~ n¡ y a Dn para p 0 ~ n¡. Para valores intermedios de Po, D* queda en algún punto entre estos dos valores extremos. De igual manera, para p 0 ~ n¡, p.* tiende a Jl.p y, para p 0 ~ n¡, p.* tiende a - P.n, quedando entre estos límites para valores intermedios de p 0 . Para un material que es precisamente intrínseco, Po = n¡ y las ecuaciones anteriores se reducen a y

p.~=

o,

(10.2-36)

de donde, la ecuación de continuidad (10.2-26) se convierte en (10.2-37)

En realidad, para un material precisamente intrínseco, se observa en (10.2-27) y ( 10.2-28), que esta es la ecuación de continuidad correcta para 8p sin importar lo grande que sea 8p en comparación con n 0 o p 0 • De la misma manera, se puede ver que esta ecuación de continuidad es aproximadamente correcta para los materiales casi intrínsecos, siempre y cuando la densidad de portadores en exceso 8p tenga un exceso muy notable en relación ecn h1 densidad de los portadores mayoritarios en equilibrio, ya que en es'te caso, p.* se hace siempre muy pequeño. Como se verá en un capítulo posterior, este hecho sunplifica enormemente el análisis de las estructuras de dispositivos semiconductores en condiciones de corriente elevada. El hecho de que p.* tienda a cero en muestras intrínsecas, no significa que los electrones y los

358 Exceso de portadores en semiconductores huecos no adquieran una velocidad de arrastre cuando se aplica un campo eléctrico, sino solamente que una distribución de la concentración de portadores en exceso no tiene arrastre en estas circunstancias. Los electrones y los huecos entran y salen de una distribución semejante aunque la distribución propiamente dicha pueda permanecer estacionaria o casi estacionaria. Se debe tener cuidado de observar que el campo eléctrico E de las ecuaciones (10.2-26), (10.2-32) y (10.2-33), se relaciona con el campo eléctrico total como lo defme (10.2-18), que incluye el campo interno originado por la difusión ambipolar y el arrastre de las partículas cargadas del sistema. Se puede derivar una expresión para este campo haciendo notar que la densidad total de la corriente eléctrica 1 se puede escribir, con la ayuda de (10.2-8), (10.2-9) y (10.2-21}, como

1 = e(J,- Jn)

= uE + e(Dn- D,)V(bp),

(10.2-38)

en donde a es la conductividad según la da (9.7-5). Resolviendo para el campo, utilizando las relaciones de Einstein para expresar las constantes de difusión en los términos de las movilidades e introduciendo la relación de movilidad b, se puede obtener

1 kT b- 1 E = - - - -b-- V(bp) = Eap.+ E;n 1• q e n +p

(10.2-39)

El primer término anterior es el campo que se crea al aplicar una fuente de potencial externo y el segundo representa el campo interno. Es evidente que el campo interno, como se expresa en el segundo término, se desvanece cuando no existe un gradiente de concentraCión de portadores y también, si las movilidades de huecos y electrones son idénticas (b = 1). En el último caso, (10.2-27) y (10.2-28) dan D* = D y p.*= [(n 0 - p 0 )/(n + p))p., en donde D y p. son el coeficiente de difusión de huecos y electrones y la movilidad. Utilizando estos valores, se puede proceder a resolver (10.2-26) usando para E el valor del campo aplicado y sin dar mayor interés al campo interno. Para materiales en los que las movilidades de los electrones y los huecos son distintas, es evidente que el campo interno contribuirá al campo total E de (10.2-26). Sin embargo, se verá que en la gran mayoría de los casos, se puede hacer caso omiso de esta contribución. La razón es que, además de los efectos que se han incorporado en los coeficientes de transporte modificados D* y p.*, el campo interno ejerce ordinariamente sólo una pequeña influencia directa en la distribución espacial de los portadores en exceso, en comparación con la de la difusión y los campos aplicados. Esto se puede demostrar comparando las soluciones de (10.2-26) en donde existe una difusión, pero no hay campo, y cuando se tiene un campo; pero esencialmente ninguna difusión. En el primer caso (suponiendo una geometría unidimensional en la que 8p varía en la dirección x, en que la velocidad de generación volumétrica en exceso g' es cero y que prevalecen las condiciones de estado estacionario de tal modo que a(8p )jat = 0), la ecuación (1 0.2-26) se reduce a (10.2-40)

Si sólo se buscan soluciones que tiendan a cero conforme x aumenta, se debe escribir (10.2-41)

Comportamiento del transporte

359

como la solución de (10.240). Por otro lado, si existe un campo constante E y si el transporte de difusión puede omitirse, (10.2-26) se puede escribir aproximadamente como d(~p)

~p

dx = - p*E-r'

(10.2-42)

cuya solución es (10.2-43)

De acuerdo con estas ecuaciones, es obvio que existe una longitud característica (D*r ) 1 / 2 asociada con el transporte puramente difusivo en el estado estacionario, y otra longitud característica p.*Er en este caso, en donde el efecto del campo es predominante. Si el campo es cero, la segunda longitud será también cero. Queda claro, de acuerdo con los resultados anteriores, que la distribución de portadores en exceso resultante del transporte puramente difusivo, no se verá muy afectado por la presencia de un campo eléctrico, a menos que dicho campo sea tan grande que p*Er sea comparable en magnitud con la longitud característica de difusión (D*r ) 1 / 2 . En otras palabras, si (10.2-44)

ó

entonces, el efecto del campo eléctrico en la distribución de la concentración de portadores en exceso será despreciable. Al incluir los valores de D* y p.* de (10.2-27) y ( 10.2-28) y el valor del campo interno dado en (10.2-39), en esta expresión, se puede obtener como condición para el gradiente de concentración que

IV(~p)l ~

1

(n

+ p)(nb + p)

.JD*t (b -

1)(no - Po)

(10.2-45)

para que el efecto del campo interno pueda omitirse en (10.2-26). En la práctica se puede proceder inicialmente omitiendo el campo interno y calculando rrp a partir de (10.2-26), utilizando el campo aplicado en el lugar de E. El gradiente de op se calcula entonces basándose en la solución resultante y se comprueba con (10.245) para asegurarse que la solución satisfaga esta condición en todos los puntos dentro de la región de interés. Si se violara (10.245), la solución tendría que rechazarse y sería necesario elaborar un nuevo cálculo en el que se incorporara el campo interno desde el principio. En sistemas puramente difusivos, se verá que la solución tiene a menudo la forma op = (const) e-xfL en donde L es aproximadamente (si no con precisión) igual a (D*r ) 1 12 • En tales casos, el gradiente de op está dado por - opfL. Se ve claramente en la forma de ( 10.245), que la condición que expresa esta ecuación nunca se viola seriamente, sean cuales fueran los valores que puedan tener n 0 , p 0 , op y b. Se pueden obtener valores mayores de V(~p) si hay un campo aplicado presente; pero en estas circunstancias, aunque la condición ( 10.245) ya no se satisfaga, se encontrará por lo general que el campo interno que se genera ahora es pequeño, en comparación con el campo aplicado que se requiere para mantener este estado. De donde, se puede llegar a la conclusión de que generalmente es buena aproximación considerar que el campo E de la ecuación (10.2-26) es el campo aplicado, sólo haciendo caso omiso del efecto explícito del campo interno. No obstante, se debe notar que el efecto del campo interno está implícitamente comprendido en los coeficientes de transporte modificados D* y p*.

360 Exceso de portadores en semiconductores Las ecuaciones de continuidad (10.2-16) y (10.2-17) conducen directamente a la ecuación diferencial ( 10.2-26) para fJp, cuando se hace la suposición de la neutralidad eléctrica. Cuando una expresión de fJp se ha obtenido como solución a (10.2-26), la validez de la suposición de neutralidad eléctrica se puede corroborar fácilmente computando la desviación de la neutralidad de carga para producir el campo interno dado por ( 10.2-39) y comparando la diferencia en las densidades de carga obtenidas de esta manera, con la densidad total de portadores excedentes que se obtuvo en la solución (Hl.2-26). Usando (9.5-12), se puede escribir la ecuación de Poisson (10.2-19) en función de las densidades de exceso fJn y fJp; si se usa (10.2-20) y (10.2-39) para expresar el campo eléctrico, se obtiene = 4ne(bp- bn) = kT ~ V 2 (bp).

V. E. IRI

e nb

K

+p

(10.2-46)

La razón de la diferencia de densidades fJp - fJn requerida para establecer el campo interno a una densidad real, fJp se puede escribir como sigue

(10.2-47) La expresión del lado derecho de esta ecuación debe ser mucho menor que la unidad para que sea válida la suposición del balance de carga ( 10.2-21 ). Esta condición se puede expresar de un modo algo diferente m•lltiplicando el numerador y el denominador anteriores por n¡. Por tanto, la condición para la validez de la suposición del balance de carga se convierte en

lbp-bponl = L ~-=---

(b- l)ni V 2(8p) 1 -- ~ D, nb + p op

2

(10.2-48)

en donde (10.2-49) ¡:s un parámetro con las dimensiones de longitud, que se conoce como "longitud intrísenca de Debye" asociada con el material. A 300°K, la longitud intrínseca de Debye es aproximadamente 34¡.t para el silicio y 0.96¡.t para el germanio. Si, como sucede con mucha frecuencia, la densidad de concentración en exceso tiene la forma fJp = (const)e±xJL en donde L es una distancia característica de decaimiento que en sistemas puramente difusivos tiene el valor (D*T) 1 12 , entonces, V2(f>p)fop = 1fL2 y (10.243) se puede expresar como bp - bnl bp

= L~, (b

- l)n; +p

L2 nb

~ l.

(10.2-50)

'

Esto deja en claro que la suposición de la neutralidad eléctrica debe ser aceptable cuando la distancia característica L es mucho mayor que la longitud intrínseca de Debye y cuando nb + p es mucho mayor que (b - l),li' Estas condiciones se satisfacen casi siempre en muestras intrínsecas o extrínsecas de silicio y germanio, a menos que el tiempo medio de vida de los portadores en exceso, T, sea extremadamente

Algunas soluciones particulares de la ecuación de continuidad

361

corto. En los semiconductores compuestos de tipo III-V, como inSb y GaAs, los tiempos de vida de los portadores, por lo general son muy cortos; para estos materiales, la condición (10.2-50) se satisface con frecuencia, aunque no siempre. Las substancias semiaisladoras en las que nb + p, al igual que L pueden ser muy pequeñas, la condición ( 10.2-50) se viola la mayor parte de las veces y es necesario aplicar otros métodos para analizar los problemas de los portadores agregados. En consecuencia, la situación es por lo general muy compleja, aunque Roosbroeck 5 desarrolló una teoría muy general para el análisis de problemas de esta índole. Puesto que la suposición del balance de carga es válida para la gran mayoria de los casos relacionados con los materiales semiconductores más conocidos, no se tomarán en cuenta explícitamente las situaciones en que se viola.

10.3

ALGUNAS SOLUCIONES PARTICULARES DE LA ECUACION DE CONTINUIDAD

A continuación convendrá examinar la forma que adquiere la solución de la ecuación de continuidad en ciertos casos especialmente sencillos e importantes. En primer lugar, se examinará lo que sucede en un cristal uniforme muy grande cuyas fronteras, para fines prácticos, pueden suponerse en el infinito, en cuyo caso no se tiene un campo aplicado ni una generación volumétrica de los pares electrón-hueco en exceso. En el tiempo t = O se supondrá que de alguna manera se ha creado una distribución espacial uniforme de densidad de portadores excedentes. En estas circunstancias V (op) = V 2 (lJp) =O, y, dado que el efecto de difusión es siempre reducir más que crear gradientes de concentración, estas cantidades seguirán siendo cero en todos los tiempos posteriores. En consecuencia, la ecuación (1 0.2-26) toma la formd d(Jp)

Jp

----¡¡-= -"7.

Si

T

es independiente de

(10.3-l)

op, esto se puede resolver fácilmente y se obtiene Jp

= p- Po=

Ae-rtr

(10.3-2)

en donde A es una constante arbitraria que aquí es igual al valor de op en t = O. En este caso, la densidad de portadores en exceso se pierde en todos los puntos de un modo exponencial en función de una constante de tiempo T igual al tiempo de vida de los portadores en exceso. Otro caso de gran importancia es la solución de estado estacionario para una muestra infinita en la que los portadores en exceso se crean a través de una fuente uniforme plana de generación que, para mayor facilidad, se supondrá que coincide con el plano yz. En este caso tampoco se tiene un campo aplicado o cualquier generación de portadores en exceso en la muestra. En estas condiciones, la densidad de portadores en exceso variará sólo a lo largo de la dirección x. Para simplificar las cosas, se estudiará el caso de una muestra tipo n fuertemente extrínseca en la que la densidad de portadores en exceso, en todas partes es mucho menor que la concentración de los portadores mayoritarios. En estas circunstancias, los coeficientes de transporte D*, JJ*, y T se reducen a los coeficientes constantes Dp, Jl.p y T P relacionados con los portadores minoritarios, y (10.2-26) se convierte en s W. van Roosbroeck, Phys. Rev., 123 474 (1961).

362

Exceso de portadores en semiconductores

{10.3-3) en donde {10.3-4)

LP = JDPtP. Las soluciones de {10.3-3) deben tener en todas partes la forma general op = p(x)- Po= Ae"/Lp

+ Be-x/Lp

(10.3-5)

en donde A y B son constantes arbitrarias. Puesto que existe una fuente plana de portadores ubicada en x =O en el plano yz, se tendrá cierto tipo de singularidad en la solución en este punto, y es mejor considerar la solución de 8p en la regiór. x O {que se llamará 8p+(x)) independientemente. Por tanto, de acuerdo con esto y con (10.3-5), éstas deben tener la forma (x >0)

{10.3-6)

(x < 0).

(10.3-7)

y op_(x) = p_(x)- Po= A_ex/Lp

+ B_e-x/Lp

Puesto que existe una velocidad de recombinación volumétrica diferente a cero. las densidades de los portadores en exceso debe tender a cero al alejarse de la fuente. Estas condiciones de frontera requieren que A+= B_ =O. Además, de acuerdo con la simetría geométrica de la situación, es evidente que 8p(x) debe ser una función par de x, por lo cual, A_= B+ = A 0 y op+(x)

= P+(x)- Po = A 0 e-xfLp

(x > 0)

(10.3-8)

op_(x)

= p_(x)- Po = Aoe"/Lp

(x < 0).

(10.3-9)

y

La concentración de electrones en exceso, de acuerdo con (10.2-21), es igual a la concentración de huecos en exceso. En la figura 10.4 se muestran los perfiles de concentración resultantes. La concentración de portadores en exceso se pierde exponencialmente en ambos lados de la fuente, plana con una distancia característica de decaimiento de Lp. La corriente de difusión de los portadores minoritarios asociada con la distribución de portadores en exceso, se puede calcular a partir de {10.2-8) y es J

p+

J p-

(x)

=

-D d(op+) P

dx

= AoDp e-x/Lp Lp

(x) = -D d(op_) = - AoDp e"'Lp P dx L p

O)

(10.3-10)

(x < 0).

(10.3-11)

(x >

Conforme x tiende a cero a través de valores positivos, Jp+ se acerca a AoDp(Lp, en tanto que conforme x se acerca a cero a través de valores negativos, Jp- tiende a

Algunas soluciones particulares de lo ecuación de continuidad

363

-x

Figura 10.4.

Concentraciones de electrones y huecos en estado estacionario dentro de un cristal infinito en el que existe, en x =O, una fuente plana para la generación de portadores en exceso.

-AoDp/Lp. La diferencia entre estas cantidades es el flujo total de la fuente o el

número de portadores minoritarios por cm 2 por segundo, emitidos por la fuente. En otras palabras, (10.3-12) en donde F 0 es el flujo de la fuente. Esta ecuación permite expresar el coeficiente A 0 de ( 10.3-8) y ( 10.3-9) en términos del flujo F 0 cuando la fuente se describe en función del flujo inicial emitido. Para una muestra que no es fuertemente extrínseca, sino en la qae la densidad de portadores en exceso, en todos sus puntos es lo suti.cientemente pequeña, las soluciones a (10.3-8) y (10.3-9) por supuesto son correctas todavía a condición de que Lp se substituya por medio deL*= (D*r) 1 12 • Para comprender la naturaleza física del transporte ambipolar, conviene examinar en detalle los flujos de electrones .y huecos. que estan presentes en esta muestra en particular. Con este fin se verá una muestra en la que la densidad de equilibrio de los portadores es arbitraria, en lugar de ver un material extrínseco tipo n. En general, habrá flujos de huecos y electrones que se originan de la difusión y, al mismo tiempo, flujos de las dos especies de portadores, que se deben a la presencia del campo interno como lo da (10.2-39). Si se observa que en la región (x >O) op+ = A 0 e-xfL •, de donde, d(op+)fdx = - op+fL*, y utilizando las relaciones de Einstein (10.2-11), los flujos de huecos y electrones debidos a la difusión se pueden escribir como sigue J

d

p+

dp+ d(()p+) p.,kT ()p+ =-D-=-D--=---P

dx

P

dx

e

L*

(10.3-13)

y

Jd n+

= -D dn+ = -D d(()p+) = P.nkT ()p+ "

dx

"

dx·

e

L* .

(10.3-14)

Los flujos de huecos y electrones que se crean debido al campo interno (10.2-39) son (10.3-15)

364 Exceso de portadores en semiconductores y (10.3-1~

Los flujos totales de electrones y huecos se pueden encontrar ahora sumando la componentes de la difusión y el campo interno. El resultado es Jl.pkT b(n+ Jp+ =Jn+ = - b e n+

+ P+) ~P+ + P+ r* •

{10.3-17)

LJ

De acuerdo con estas ecuaciones, la fracción del flujo total de las dos especies de portadores que se debe a la difusión y a la presencia del campo interno se puede calcular con suma facilidad. Se encontrará que J~+

n+b Jp+ = b(n+

J~+

J~+ n+b + P+ -= Jn+ n+ + P+

+ P+ + P+)

{10.3-18)

P+(b- 1)

Jp+ = b(n+

+ P+)

Es muy interesante examinar estas expresiones en los tres casos específicos: materiales extrínsecos tipo n, en donde n+ ~ P+, materiales extrínsecos tipo p, en donde P+ ~ n+ y el material intrínseco, en donde n+ = P+· En estos tres casos, las ecuaciones (10.2-18) se convierten en intrínseco (n+ = P+)

b+l

1. '

2b

1 b'

O;

1--.

b;

1. '

1- b;

o·'

b-l 2b

b+l

(10.3-19)

2

l-b 2

De acuerdo con estos resultados, es obvio que en las muestras extrínsecas, el flujo de portadores minoritarios debidos al campo interno es insignificante en comparación con el flujo de difusión. Sin embargo, el flujo de portadores mayoritarios debido al campo es importante. En efecto, este flujo debe ser tan grande que asegure la casi neutralidad en todos los puntos. Por tanto, debe compensar el desequilibrio entre los flujos de difusión de portadores minoritarios y los mayoritarios originados por la desigualdad de los coeficientes de difusión de los electrones y los huecos. Esta situación se puede comprender mejor observando en (10.2-39) que, en muestras extrínsecas, la magnitud del campo externo se hace muy pequeña debido al factor nb+P del denominador que se hace muy grande en muestras extrínsecas. No

Algunas soluciones particulares de la ecUJJción de continuidad

365

obstante, el flujo de portadores mayoritarios que se produce debido al campo interno sigue siendo apreciable, ya que es proporcional al producto del campo interno muy pequefio y la gran densidad de portadores mayoritarios. Por supuesto, el flujo de portadores minoritarios debido al campo interno es extremadamente pequefio, puesto que tanto el campo interno como la densidad de portadores minoritarios son pequefios. Por otra parte, los flujos de difusión de los portadores mayoritarios y minoritarios dependen sólo de los gradientes de concentración y los coeficientes de difusión inherentes, tanto de electrones como de huecos, y, puesto que los gradientes de concentración de electrones y huecos son los mismos, deben ser comparables en magnitud y difieren sólo en una cantidad proporcional a la diferencia entre las difusibilidades inherentes de los dos portadores. El estudio de esta situación puede llevar a explicar por qué en las muestras extrínsecas, el coeficiente de difusión ambipolar es el coeficiente inherente de difusión de los portadores minoritarios. En estas condiciones, el campo interno es pequefio y puede crear flujos relativamente grandes de portadores mayoritarios; pero se desecha su influencia en el flujo de portadores minoritarios. En consecuencia, el flujo de portadores minoritarios se debe exclusivamente a la difusión de los portadores minoritarios y en esencia no se lo afecta el campo interno. El flujo de portadores minoritarios observado, por ende es el que producen independientemente los portadores minoritarios en difusión. Para que se satisfaga la situación de casi neutralidad, el flujo de portadores mayoritarios debe ser el mismo. Parte de este flujo se debe a la difusión de los portadores mayoritarios; pero, puesto que las difusibilidades inherentes de las dos especies de portadores son desiguales, se tendrá un déficit (o exceso) inevitable. Este déficit o exceso puede deberse al flujo de portadores mayoritarios cuya fuente es el campo interno. El efecto neto es que los flujos de electrones y huecos son iguales entre sí y al flujo que produciría una distribución de portadores minoritarios difundiéndose imdependientemente; es así como se relaciona el -::oeficiente de difusión de la distribución de portadores en exceso con los portadores minoritarios. Por tanto, en sistemas extrínsecos casi siempre se requiere considerar explícitamente sólo el comportamiento de los portadores minoritarios. Por supuesto, en muestras que son intrínsecas o casi intrínsecas, es importante el efecto del campo interno en los dos tipos de portadores. Este caso se ilustra en la expresión (10.3-19) y a través de la dependencia de los coeficientes de transporte ambipolar en relación con la difusibilidad o movilidad de electrones y huecos. Aunque estos resultados se vieron en conexión con una muestra específica más restringida, es evidente que los principios físicos implícitos son los mismos en todos los sistemas y que las conclusiones obtenidas tienen una aplicación general. Ahora se puede constatar que los flujos de difusión de los portadores minoritarios (10.3-10) y (10.3-11) son los flujos totales de los portadores minoritarios en el caso de una muestra extrínseca tipo n. En un cristal que no es extrínseco, los flujos totales de electrones y huecos se pueden obtener de (10.3-17), escribiendo b = JJ.n/JJ.p y usando las relaciones de Einstein, en la forma

(10.3-20)

Por supuesto, dado que en esta muestra no se tiene un campo aplicado, la corriente eléctrica total 1 = e(JP + - J n +) es cero. A continuación se estudiará la extensión de la solución precedente para el caso en que existe un campo constante aplicado E 0 en la dirección positiva n. La ecuación diferencial (10.2-26) se puede escribir para el material extrínseco tipo n como

366

Exceso de portadores en semiconductores

d_2 (bp) d(bp) _ 0 _2_ _ f.1pEo ___ _ _ _bp __ dx DP dx LP

o

(10.3-21'

Esta ecuacton se puede resolver utilizando las técnicas normales aplicables ecuaciones diferenciales lineales con coeficientes constantes, lo que da

i5p(x) = p(x)- Po=

AeYp+xfLp

+ BeYp-x/Lp

¡

(10.3-22)

en donde (10.3-23, y (10.3-24) Esta solución es la misma que (1 0.3-5) excepto que los argumentos de lO!i factores exponenciales se multiphcan por los factores 'Yp+ Y - 'Yp-, que depender; del campo eléctrico. De acuerdo con la definición dada antes, se ve claramente que. sea cual fuere el valor que pueda tener E 0 , 'Yp+ debe ser siempre positivo, mientras que 'Yp- debe ser siempre negativo; cuando 'Yp+ y 'Yp- se grafican en función del campo, las dos cantidades se representan por medio de dos ramas de una hipérbola_ como se ilustra en la figura 10.5. Para 'YP = O, a un campo cero, ( 10.3-14) se reduce f (Yp)

3

-3

Figura 10.5.

Gráfica de las funciones 'Yp+ y 'Yp-·

a la ecuación de la sección anterior. Para valores positivos grandes de 'Yp (y, por ende, para campos tales que E 0 ;p 2kTfeLp), se puede demostrar con la ayuda de la expansión binómica y (10.24) que

LP

--= ----

(10.3-25)

mientras que es obvio que, en estas circunstancias, (10.3-26)

Algunas soluciones particulares de la ecuación de continuidad Se puede ver claramente en (10.3-15) que siempre por medio de

'Yp+ y 'Yp-

'l'p+'l'p- =-l.

367

están relacionados

(10.3-27)

Ahora se puede repetir el desarrollo del caso del campo cero que se da en las ecuaciones (10.3-6) (10.3-12), suponiendo, como antes, que hay dos expresiones separadas para l>p+(x) en la región x >O y l>p_ (x) en la región x
(x > O)

(10.3-28)

(x < O)

(10.3-29)

en donde A 0 es una constante arbitraria que expresa la intensidad de la fuente de generación. La concentración de electrones en exceso será igual a la concentración de huecos en exceso. En la figura 10.6 se ilustran los perfl.les de concentración para un valor positivo de E 0 . Puesto que las características de transporte de la distribución de portadores en exceso son prácticamente las de los portadores minoritarios, tenemos que el transporte de los portadores en exceso hacia la derecha (en dirección del movimiento de los huecos bajo un campo aplicado) se ve favorecido por la acción del campo, en tanto que se retrasa el transporte de portadores en dirección opuesta. De acuerdo con ( 10.3-25), se puede verificar que (1 0.3-28) tiende al resultado que se obtuvo antes, (10.2-43), para campos grandes aplicados, como sería de esperarse. Al igual que antes, los flujos de partículas portadoras minoritarias Jp+(x) y Jp_(x) pueden calcularse a partir de (10.2-8); las contribuciones se obtienen ahora tanto del término de difusión como del término del campo eléctrico. Parte del flujo de partículas resultante se deberá al arrastre de los huecos que están presentes en equilibrio térmico cuando, el campo está aplicado, y otra se deberá a la difusión p(x), n(x)

---

--------~

-------------Figura 10.6.

Concentraciones de electrones y huecos en un estado estacionario, dentro de un cristal en el que existe, en x =O, una fuente plana de portadores en exceso y estando presente un campo eléctrico constante en la dirección x.

368 Exceso de portadores en semiconductores y al arrastre de la distribución de portadores en exceso. El flujo producido por este último efecto, evaluado en el plano de la fuente, es (10.3-30}

Esta ecuac10n es análoga a (10.3-12), que relaciona al coeficiente de amplitud Ao con el número total de portadores por unidad de área por unidad d~ tiempo, Fop. generados en el plano de la fuente. Cuando la muestra no es fuertemente extrínseca y cuando la densidad de los portadores agregados es lo suficientemente pequefia, las soluciones anteriores seguirán siendo válidas a condición de que Dp, JJ.p, Lp y r P se substituyan respectivamente por D*, JJ.*, L * y r. Las mismas observaciones que se hicieron sobre la relación de los flujos debidos a la difusión y a los campos internos en conexión con el caso libre de campo. también se aplican en esta situación; por ejemplo, en una muestra extrínseca, el flujo de portadores minoritarios producido por el campo interno es despreciable en comparación con el flujo de difusión correspondiente, mientras que los flujos de los portadores mayoritarios atribuibles a cualquiera de las dos fuentes tienen una magnitud comparable. Sin embargo, ahora se cuenta además con flujos grandes de los dos tipos de portadores, comprendiendo tanto a los portadores en exceso como a los de equilibrio, debido al campo aplicado. Estos flujos se superponen a los flujos producidos por la difusión y los campos internos; como resultado, la densidad total de la corriente eléctrica ya no se desvanece, sino que por el contrario se representa por medio de aEapl· En relación a esto, se debe observar que el ejemplo que se está estudiando comprende sólo una situación en la que 8p es, en todos sus puntos, mucho menor que la densidad de portadores mayoritarios en equilibrio. Puesto que la densidad total de corriente eléctrica debe ser la misma en todas partes, una situación en la que Dp es lo suficientemente grande para modular apreciablemente la conductividad, implicaría un campo que no puede ser constante; pero que es grande cuando Dp es pequeño y viceversa. Para valores pequeños de Dp, subsiste la misma dificultad, pero las variaciones correspondientes del campo son tan pequeñas que el planteamiento del campo constante constituye una aproximación aceptable. Por supuesto, existen muchas otras dificultades que se presentan cuando [)p se hace comparable a la densidad de portadores en equilibrio. Como ejemplo final, se verá un sistema uniforme unidimensional en el que se generan simultáneamente N pares de electrón-hueco en un punto x = x' al tiempo t = t'. Se supondrá que la muestra se extiende al infinito en ambas direcciones a lo largo de eje x y que se aplica un campo eléctrico constante E 0 . Por tanto, para una muestra extrínseca tipo n, la ecuación ( 10.2-26) se convierte en

(10.3-31)

Una solución de esta ecuacwn, válida para todos los valores t > t' que satisfaga todos los requisitos del problema es _(

)_

op x,t -

t- t']

N _ __ exp [ - {(x- x')- JJ.pE 0 (t- t')} 2 - - - . ../4rrDp(t- t') 4Dp(t- t')


(10.3-32)

Algunas soluciones particulares de la ecuación de continuidad

369

El hecho de que (10.3-32) satisface la ecuación diferencial (10.3-31), se puede establecer por substitución directa. 6 Se puede demostrar fácilmente que el valor inicial op(x, O) es cero en todos los puntos excepto cuando x = x', punto en el que se hace infmito. La distribución inicial de concentración, entonces corresponde a una función o de Dirac. Para tiempos posteriores, la distribución tiene una forma gaussiana, cuya anchura media aumenta con respecto al tiempo y cuya amplitud máxima decrece con relación al tiempo. El punto de concentración máxima se desplaza también a lo largo de la dirección del campo, a una velocidad JJ.pEo. La expresión (10.3-32) se puede integrar sobre x entre los límites - oo y + oo (haciendo que u= (x- x')- JJ.pE 0 (t- t'), de donde, du = dx, y t se considera constante) para obten~r el número total de huecos en exceso oP en la distribución como una función del tiempo. El resultado es

i5P(t)

=

J~oo bp(x,t) dt =Ne

-(1-t')/rp.

(10.3-33)

Por tanto, el número total de portadores, que es N originalmente, desciende de un modo exponencial con la .::onstante de tiempo T P, como podría esperarse. En la figura 10.7 se ilustra el comportamiento de la concentración de portadores en exceso en función de x y t.

8P(x,t)

8P (x,t) t=O

t=O

-x

(al Figura 1O. 7.

-X

(b)

(a) Dispersión difusiva de portadores en exceso inyectados inicialmente como una distribución en x =O, sin tener un campo eléctrico aplicado. (b) Dispersión difusiva Y arrastre de la distribución en (a) aplicando un campo eléctrico constante en la dirección x. En ambos casos O
o

Si ahora se revisa la definición de N, la intensidad inicial de la fuente, tomando a N(x', t') dx' d t' como el número de huecos o electrones en exceso generados en un intervalo d t' alrededor de t = t', dentro del elemento de espacio dx alrededor de x = x', entonces, la concentración subsecuente debida a este elemento de generación en función de x y t se obtendrá substituyendo N de (10.3-32) con N(x', t') dx' dt'; la distribución de concentración resultante debe marcarse como una función de x' y t', al igual que de x y t, es decir, se debe escribir como sigue: 6 La solución de (10.3-32) se puede obtener por medio de las técnicas de transformación de Laplace o por la integral de Fourier.

370

Exceso de portadores en semiconductores

óp(x,t;x',t'). La concentración óp(x,t) que se ongma de una distribución arbitraria conocida de generación cuya intensidad puede variar con las coordenadas del espacio y el tiempo x', y t' se puede calcular superponiendo soluciones de esta forma, cada una de las cuales se caracteriza por la intensidad de generación local N(x', t') dx' dt'. Esta superposición de elementos infinitesimales, cada uno con su propia intensidad de fuente local, lleva a una integral sobre dx' y dt' de la forma

bp(x,t) =

I

r foo

-oo

-oo

N(x',t') [ {(x - x')- J1 E 0 (t- t')} 2 exp P .j4nDp(t- t') 4Dp(t- t')

-

t - t'] , , dx dt . rP

--

(1 0.3-34)

Por supuesto, la integral se desarrolla sólo hasta t' = t, debido a que la generación futura no contribuye a la concentración observada al tiempo t. Naturalmente, la solución anterior se aplica sólo a una muestra infmita en que la distribución de concentración satisface la condición de frontera de que la concentración debe tender a cero lejos de la fuente. Para muestras finitas, primero se deberá encontrar una solución para una función ó de distribución de fuente inicial, por ejemplo, (10.3-32): pero satisfaciendo además las condiciones de frontera apropiadas en las superficies de la muestra. 7 Entonces se podría usar el mismo procedimiento de superposición para obtener la solución de una distribución arbitraria de ~eneración con respecto a las coordenadas del espacio y el tiempo para muestras de esta clase. Este procedimiento se puede generalizar con cierta facilidad a sistemas tridimensionales. La solución para una generación instantánea de N(r', t') dv' dt' dentro del elemento de volumen dv' alrededor del punto r = r' al tiempo t = t', describiendo la distribución de concentración subsecuente que se origina de este elemento de generación inicial dentro de una muestra infmita, es . , , _ N(r',t') du'dt' ex [- {(r- r')- J1pE 0 (t- t')} 2 bp(r,t,r,t)-[4nDp(t-t')]f p 4Dp(t-t')

_

t- t'] rP ·

(10.3-351

En este caso se puede verificar también que (10.3-35) es una solución para la ecuación tridimensional de difusión correspondiente a {10.3-31) por medio de una substitución directa. La superposición de soluciones de la forma (10.3-35) ahora se puede hacer en la misma forma que antes, dando como resultado una integral sobre la distribución de la fuente de generación de la forma

.

op(x,t) =

J' -oc

f

N(r',t') [ {(r- r')- J1pE 0 (t- t')} 2 t- t'] 'd, , t exp , - - - dv t . v[4nDP(t-t)] 4Dp(t-t) rP

Se descubrirá que casi todas las soluciones particulares de la ecuación de continuidad que se han descrito en esta sección, son útiles para estudiar trabajos experimentales relacionados con distribuciones de portadores en exceso o estructuras de dispositivos semiconductores de importancia tecnológica.

7 Por lo general, la solución para una distribución inicial de fuente de una función ó se cita como la función de Creen apropiada para un sistema dado y un conjunto particular de condiciones de frontera.

Movilidad de arrastre y el experimento de Haynes-Shockley 10.4

371

MOVILIDAD DE ARRASTRE Y EL EXPERIMENTO DE HAYNES-SHOCKLEY

El experimento de Haynes-Shockley se realizó originalmente para medir con precisión y de un modo directo, la movilidad de arrastre de huecos y electrones en cristales semiconductores. 8 Aunque tiene un gran interés debido a que fue la primera medición directa 9 de la velocidad de arrastre de los portadores de carga, que se realizó con verdadero éxito, también es muy instructivo para dilucidar el comportamiento de transporte de electrones y huecos en exceso en semiconductores, y también para demostrar las características básicas del funcionamiento del transistor, ya que el circuito Haynes-Shockley es, en efecto, un tipo de transistor.

- ,,,,1-+----.

+o-+-------. Generador de pulsos

Batería del colector

Señal Sincro·

.-+--+-o Osciloscopio

~~~~~~~~~----,~~~,~~~~

1

x=O

1

x=d

1111111-------1

L...---'llfl'.~-----1+ Batería de barrido Figura 10.8.

Diagrama esquemático del experimento de Haynes-Shockley.

Como se ilustra en la figura 10.8, en el experimento de Haynes-Shockley se inyecta un exceso de portadores minoritarios al cristal y se recogen de éste mediante un contacto de puntas de prueba metálicas. Aunque se debe posponer una descrip· ción detallada de lo que sucede en un contacto rectificador de puntas de metal, en la figura 10.9 se capta una idea general de su comportamiento. En esta ilustración se describe una muestra de semiconductor en el que se ha establecido un contacto de puntas de prueba y se ha formado una gran zona de contacto. El área grande de contacto, que se puede haber fabricado apropiadamente por soldadura, una región de aleación o por un contacto a presión, actúa como un contacto óhmico de la muestra y no afecta considerablemente a la distribución de portadores en la muestra. Sin embargo, la punta de prueba actúa como un contacto rectificador; cuando se polariza de tal manera que atraiga hacia ella a los portadores minoritarios, actuará como un colector de portadores minoritarios vaciando la región del cristal adyacente a ella de estos portadores, hasta que se llega a un estado estacionario en que los portadores minoritarios se difunden desde el interior del cristal con la suficiente rapidez para satisfacer el déficit causado por su desaparición en las puntas de prueba. En estas condiciones J. R. Haynes y W. Shockley, Phys. Rev., 81, 835 (1951). En contraste con el efecto de Hall que sólo admite la determinación indirecta de la movilidad. 8 9

372

Exceso de portadores en semiconductores

--+---

+----=n-type =

+

Inyecta huecos corriente grande

Colecta huecos corriente pequeña

(b)

(o)

Colecta electrones corriente pequeña (e)

1nyecta electrones corriente grande (d)

1

1

==;;;:¡;of---v DiaQramas de cornente·voltaje

Figura 10.9.

tipo·n

tipa-p

(e)

( f)

Rectificador semiconductor con contactos de puntas (a) tipo n. con polarización inversa, (b) tipo n con polarización directa, (e) tipo p con polarización inversa, (d) tipo p con polarización directa, (e) característica corriente-voltaje del rectificador tipo p de contacto de puntas.

(que se conoce como polarización inversa), esta corriente de portadores minoritarios es la única que puede fluir por la punta de prueba y, puesto que es muy pequeño el abastecimiento de portadores minoritarios del cristal, el flujo de la corriente se reduce mucho y es relativamente independiente del voltaje de polarización, ya que al suministro de portadores minoritarios no le afecta el cambio del voltaje de polariza. ción inversa. Esta situación se ilustra en la figura 10.9(a) y (e) para materialeJ semiconductores tipo n y p. Cuando el voltaje de polarización se invierte para atraer a portadores mayoritarios a la punta de prueba, se encuentra que, además del flujo de éstos hacia ella, se inyecta un exceso de portadores minoritarios a la muestra en el contacto de puntas. En esta forma de operación, la corriente fluye con facilidad y se pueden alcanzar flujos de corriente relativamente grandes con pequeños voltajes de polarización. Se ha encontrado que la corriente aumenta de un modo más o menos exponencial conforme se incrementa el voltaje de polarización, y no es difícil producir un número suficiente de portadores inyectados para modular con gran fuerza la conductividad del semiconductor. 10 En la figura 10.9(b) y (d) se muestra el caso de esta polarización directa. Las relaciones corriente-voltaje para cristales tipo n y tipo p se ilustran en el mismo conjunto de diagramas en (e) y (f), respectivamente. El efecto de rectificación por contacto de puntas, como se presenta en (e) y (f), en efecto proporciona una prueba muy sencilla para distinguir los cristales semiconductores tipo n de los tipo p. lO Debe recordarse que un exceso de concentración de los portadores mayoritarios siempre debe ir acompañado de una distribución de portadores minoritarios en exceso. Los portadores mayoritarios necesarios para conservar la neutralidad eléctrica abundan en el volumen dd cristal de donde se extraen atraídos mientras se forma la distribución de portadores minoritarios en exceso. Cualquier déficit resultante en la concentración de portadores mayoritarios en d volumen se contrarresta inmediatamente con los portadores mayoritarios obtenidos por el contacto metálico óhmico.

Movilidad de arrastre y el experimento de Haynes-Shockley

373

En el experimento de Haynes-Shockley se inyectan portadores minoritarios en el emisor e de la f:tgura 10.8. La muestra tiene la forma de una barra larga y delgada, y se establece un campo eléctrico mediante una batería externa que, por supuesto, hace que fluya una corriente ls por la muestra. Este campo eléctrico barre los portadores minoritarios inyectados dentro de la muestra, pasando por un segundo electrodo ubicado a una distancia conocida d del primero, que se polariza de un modo inverso, de tal manera que actúa como colector de portadores minoritarios. Cuando no se tienen portadores en exceso en el colector, la única corriente que fluye en dicho electrodo es una pequefia corriente de saturación que se debe a la recolección de portadores minoritarios de equilibrio que realiza la punta de pruebas. Conforme la distribución de portadores minoritarios inyectados pasa por el colector, la concentración de éstos en su cercanía va en aumento y el número de ellos que se recoge allí por unidad de tiempo asciende proporcionalmente. Si el trazo del osciloscopio se inicia en el momento en que se inyecta originalmente el impulso de portadores, no se observará nada en la pantalla hasta que la distribución de portadores en exceso haya llegado al colector, tiempo en el que la corriente de colector se incrementará y se observará un impulso de sefial en el osciloscopio. Puesto que la concentración de portadores en exceso es una función de la distancia x en la dirección de la muestra, es básicamente la que se da en (10.3-32) y que se ilustra de un modo gráfico en la figura 10.7(b), es evidente que el máximo de la distribución de concentración se desplaza también, con una velocidad igual a JL*E0 , en donde JL* es la movilidad ambipolar y E 0 es el campo aplicado. (En (10.3-32) se supone que las condiciones son tales que D* y JL* son iguales a Dp y Jlp; pero es posible que esto no pueda aplicarse a todos los casos.) Parece que el tiempo t 0 requerido para que el máximo del impulso de concentración atraviese la distancia conocida d entre el emisor y el colector es d d v- Jl*Eo

1 ----0-

(10.4-1)

lo cual da Jl * =dtoEo

(10.4-2)

Si las condiciones son tales que JL* es igual a - Jln o Jlp (es decir, si la muestra es fuertemente extrínseca), este experimento permite medir con precisión la movilidad de arrastre de los portadores minoritarios. Desafortunadamente el impulso que llega al colector no es perfectamente agudo, sino que más bien es ancho debido a la difusión, como se ve en la figura 10.7(b). Esto no causa dificultades en las mediciones; pero origina ciertos errores en la interpretación de los datos, a menos que se tenga un cuidado extremo. Pues lo que realmente se ve en la pantalla del osciloscopio no es una gráfica de la concentración en función de la distancia en un tiempo fijo dado, sino una gráfica de la concentración en un punto específico en función del tiempo, 8p(d,t). Una medición del máximo de esta curva no representa exactamente el tiempo de arrastre, a menos que se arreglen las condiciones del experimento de tal suerte que se produzca un mínimo de dispersión por difusión, conforme la distribución sufre un arrastre entre el emisor y el colector. Por ejemplo, supóngase que el campo aplicado es cero. Entonces, la distribución de portadores en exceso se difundirá como se indica en la figura 10.7(a). Sin embargo, aunque no haya un campo aplicado en este caso, se ve claramente en la figura que se observará un máximo de la concentración como función del tiempo, en un punto x = d. En el ejemplo presentado en esa figura, el máximo se produce más o menos en t = t 3 • Este máximo se observa simplemente porque el transporte por difusión por sí solo basta para mover el exceso de porta-

~

374

Exceso de portadores en semiconductores

dores perteneciente a la distribución, del emisor al colector y luego más allá. Este efecto conduce a la observación de un tiempo de arrastre finito en ausencia de UD campo que, de acuerdo con (10.4-2) corresponderá a una movilidad infinita. Evidentemente, si lo que significa tiempo de arrastre t 0 es el lapso que transcurre entre la inyección y la observación del valor máximo obtenido por op(d,t), según lo cla ( 10.3-32) (y que es lo que en realidad se mide en el trazo del osciloscopio), entonces, la ecuación ( 10.4-2) no puede ser correcta tal y como está expresada. En realidad, la ecuación (10.4-2) es más o menos correcta siempre que l2 dispersión por difusión de la distribución de portadores sea razonablemente pequeña durante el tránsito del emisor al colector. Estas condiciones se pueden efectuar experimentalmente mediante el uso de campos aplicados muy grandes que, no obstante, producen efectos de calentamiento graves a menos que se recurra a técnicas de pulsos muy laboriosas. Una alternativa es derivar una expresión correcta para el tiempo de tránsito a partir de (10.4-2) que toma totalmente en cuenta la difusión para llegar a una expresión modificada 11 de la forma (10.4-31 en donde

x = 2kT eE 0 d

(~ + ~). r

2

(10.4-41

Por supuesto, es necesario conocer el tiempo de vida de los portadores en exceso T para utilizar esta fórmula; sin embargo, como se verá más adelante, esta cantidad se puede determinar fácilmente mediante una simple medición independiente. Los detalles del cálculo de (10.4-3) quedan asignados como ejercicio para el lector. En el capítulo 13 se demostrará cómo el funcionamiento del transistor se puede explicar y comprender basándose en el experimento de Haynes-Shockley. Si se mide tanto la dispersión de la difusión, como el tiempo de tránsito, se puede determinar el coeficiente de difusión D* al igual que la movilidad de arrastre, aplicando la técnica Haynes-Shockley. Esta posibilidad se ha utilizado 12 para verificar experimentalmente la relación de Einstein en muestras de germanio muy extrínsecas.

10.5

RECOMBINACION SUPERFICIAL Y CONDICIONES DE FRONTERA SUPERFICIALES

Si el efecto de las superficies de un cristal fmito tuviera como único fin confmar a los portadores de carga al interior de la muestra, entonces la condición de frontera que la distribución de portadores de carga en exceso tendría que satisfacer en las superficies de la muestra sería simplemente que las corrientes de electrones y huecos deben desvanecerse en las superficies. Sin embargo, la situación no es tan sencilla, ya que los portadores de carga pueden recombinarse err la superficie por medio de mecanismos que son muy independientes de los que regulan las velocidades 11

J. P. McKelvey, J. Appl. Phys., 27, 341 (1956).

Transistor Teachers Summer Schooll (Bell Telephone Laboratories), Phys. Rev., 88. 1368 (1952). 12

Recombinación superficial y condiciones de frontera superficiales

375

de recombinación de los portadores de carga en el interior de la muestra. En estas circunstancias, la superficie actúa como un absorbedor parcial de electrones y huecos, y puede haber una corriente neta que fluye hacia las superficies de la muestra. A primera vista, se podría pensar que, puesto que los electrones y los huecos pueden recombinarse en la superficie de un cristal, debe haber una deficiencia en la concentración de portadores de carga cerca de la superficie, que produciría una corriente difusiva de portadores hacia la superficie, aun en el estado de equilibrio térmico. No obstante, esto no sucede debido a que, además de la recombinación, la generación térmica de pares electrón-hueco se produce también en la superficie y, en condiciones de equilibrio térmico, la velocidad de generación es idéntica a la velocidad con la que los pares de portadores se recombinan en la superficie. Por tanto, no existe un flujo neto hacia la superficie ni se produce cambio alguno en las concentraciones de la regtón de la superficie en condiciones de equilibrio térmico. 13 Esta situación es un ejemplo específico de un principio muy general de la mecánica estadística, denominado el principio del balance detallado o el de la reversibilidad microscópica. Este principio establece que en la condición de equilibrio térmico, cualquier proceso microscópico dado y su proceso inverso debe producirse a la misma velocidad. Ya se encontró antes un ejemplo de la validez de este principio cuando se comprobó que la velocidad de recombinación volumétrica en equilibrio de pares electrón-hueco y la velocidad de generación térmica volumétrica son iguales. La situación actual, en que la velocidad de recombinación superficial y la de generación térmica superficial son iguales en la condición de equilibrio, sirve sólo para ilustrar la misma ley general. Por supuesto, debe hacerse notar que el principio del balance detallado se aplica sólo al estado de equilibrio térmico. En el ejemplo que se estudia, la velocidad de generación térmica superficial es una función exclusiva de la temperatura y es muy independiente de las concentraciones locales de portadores de carga, en tanto que la velocidad de recombinación depende clara y directamente de las concentraciones locales de portadores. Si la concentración local de los portadores de carga excede el valor del equilibrio térmico, la velocidad de recombinación superficial sobrepasará la velocidad de generación superficial y como resultado se tendrá una absorción neta de portadores en la superficie que, a su vez, establecerá un flujo por difusión de portadores hacia ella. Si se tiene una deficiencia de concentración de portadores en exceso en la cercanía de la superficie, también se producirá un flujo por difusión de portadores en exceso térmicamente generados que se aleja de la superficie. Por supuesto, se pueden hacer observaciones similares en relación al flujo de portadores en el volumen, que se originan por excesos o deficiencias locales en las concentraciones volumétricas de portadores. Es importante comprender que estas conclusiones generales son válidas independientemente de los mecanismos en particular implicados en los procesos de generación y recombinación. El efecto de la recombinación superficial sobre la distribución de portadores de carga dentro de la muestra se puede investigar ahora, considerando el intercambio de flujo entre la superficie y la región interior de la muestra, como se ilustra en la figura 10.10. Se principiará definiendo el coeficiente de reflexión superficial R 0 como la probabilidad de que un solo portador, en una sola colisión con la superficie, sea devuelto al interior del volumen en lugar de ser absorbido por recombinación. La probabilidad correspondiente de recombinación, por tanto es 1 -- R 0 • De igual manera, el coefi13 Este enunciado se aplica al modelo simple de la superficie que se está viendo. Existen cambios en la concentración de portadores en equilibrio cerca de la superficie asociados con una capa de carga espacial superficial, originada por la presencia de estados superficiales, en la superficie física real de la muestra como se verá más adelante. El punto de vista sencillo aquí adoptado casi siempre es adecuado para un estudio fenomenológico de la recombinación superficial.

376

Exceso de portadores en semiconductores

Flujo incidente neto

Flujo que se desarrolla debido a la generación térmica superficial

A

F,8 -X

Concentración local de portadores en la región de la superficie: P, interior: coeficiente de reflexión B Figura 10.10.

Superficie: coeficiente de reflexión Ro

Diagrama de flujo que ilustra el intercambio de flujos entre el interior y la superficie.

dente de reflexión volumétrica B se define como la probabilidad de que un portador, al entrar al interior del cristal, proveniente de la superficie, reaparecerá en ésta en el curso de su desplazamiento aleatorio a través del material antes de recombinarse en el interior. Se supone que estos coeficientes son independientes de los flujos o las concentraciones de portadores. Entonces, se puede considerar el sistema de flujos establecido entre la superficie y el interior, como se ilustra en la figura 10.10. Se supone que hay un flujo neto de partículas de magnitud A, que se origina en el interior, y el flujo de generación superficial gs está dirigido de la superficie al interior del cristal. La superficie del cristal de la figura 10.1 O se muestra separada del interior para ilustrar con claridad el intercambio de flujos entre estas dos; pero. por supuesto, las dos regiones son físicamente contiguas en realidad. El flujo total F 1 , que va del interior a la superficie, y el flujo inverso total F ~ se pueden obtener observando que F 1 se compone del flujo incidente A más la parte de F; que es reflejado por el volumen, de donde, (10.5-1)

De igual manera, (10.5-2)

Estas dos ecuaciones se pueden resolver para F 1 y F;, y dan

F _A+ Bg, 1 -

l-R 0 B

(10.5-3)

y

, _ g, + AR 0 F¡ 1- R 0 B

(10.5-4)

Ahora se puede demostrar fácilmente que, para una distribución de partículas libres que obedece a la estadística de Boltzmann, el número de partículas por unidad de tiempo que cruza una superficie plana de área en cualquier dirección, es

Recombi1lllción superficial y condiciones de frontera superficiales

377

pCJ4, en donde pes la concentración local de partículas. 14 En el estado de equilibrio térmico, la concentración de partículas es p 0 en todos los puntos y F 1 = F; = p 0 c/4.

(10.5-5)

Estos valores de F 1 y F; se puede substituir en (10.5-3) y (10.5-4) y el par de ecuaciones resultantes se resuelve para g8 y A 0 , que es el valor del flujo incidente A en condiciones de equilibrio térmico, lo cual da Po e g.= --¡-(1- R0 )

(10.5-6)

Po e --¡-(1- B).

(10.5-7)

y

A0

=

Ya se vio en el argumento anterior que, en el estado de equilibrio térmico, F 1 y F; tienen el valor común pc/4. Si existe una desviación del equilibrio térmico producida por un flujo por difusión establecido por un gradiente de concentración, y si esta desviación del estado de equilibrio es tan pequeña que la distribución de Boltzmann sigue siendo más o menos correcta en todos los puntos del sistema, entonces, F 1 y F 1' ya no serán iguales. En estas circunstancias, se debe tener en c"Uenta el flujo positivamente dirigido que llega al punto x 0 y que se originó, en promedio, a una distancia del orden de la trayectoria libre media "corriente arriba" y el flujo negativamente dirigido que llega al mismo punto y que se originó a una distancia promedio del orden de la trayectoria libre media "corriente abajo". Entonces, el flujo con dirección positiva F; se puede escribir como sigue



=

]:¡·e [p(xo)- ,(ap) ax ::XA

xo

(10.5-8)

en donde a es una constante numenca del orden de la unidad, ya que la cantidad entre paréntesis angulares representa, aproximadamente la concentración local en el punto en que se originó el flujo que llega a x 0 • De igual manera, el flujo con dirección negativa F 1' se puede escribir como (10.5-9) Es obvio que la

~urna

de los flujos debe ser, entonces, (10.5-10)

en donde p es la concentración local, independiente del gradiente de concentración, con tal que la función de distribución no se perturbe seriamente de su forma en equilibrio. Si se usa (10.5-10) para expresar la suma de los flujos F 1 y F; en la región de la superficie y, si se usan las expresiones (10.5-3), (10.5-4) y (10.5-6) para representar F 1 , F; y g8 , se obtiene 14

Por ejemplo, véase el ejercicio 7 que aparece al final del capítulo 5.

378

Exceso de portadores en semiconductores

p.c _ F

T -

1

+

F' _ A(1 + R 0 ) 1 1 - R0 B

p0 c (1 - R 0 )(1 + B)

+4

1 - R0 B

'

(10.5-11)

en donde Ps representa la concentración en la cercanía de la superficie. Por supuesto, se debe recordar que, aunque g8 tiene el mismo valor que en el estado de equilibrio térmico, esto no se aplica a A, cuya magnitud depende de la naturaleza de la distribución de portadores en exceso que pueda estar presente en el volumen. En efecto, la ecuación (10.5-11) debe resolverse para A, de tal modo que dé

p.c 1 - R 0 B A=---2 1 + R0

Poc (1 - R0 )(1 + B) 4 1 + R0

(10.5-12)

F:

es el flujo neto de portadores que, si no se tiene La diferencia entre F 1 y un campo eléctrico, como se supondrá, es igual a la corriente neta de difusión -Dp(o(fJp)/ox) evaluada en las superficies. Si se escribe la expresión para F 1 - F 1'. usando (10.5-3) y (10.54) para representar los flujos y a (10.5-6) y (10.5-12) para representar los valores de g8 y A, se puede obtener, después de numerosas operaciones algebraicas complejas, pero directas, F1

_

F~ = A(l - R 0 ) 1 - R0 B

_

g.(l - B) =(p.- p 0 )c 1 - R 0 = -DP(i!(bp)). 1 - R0 B 2 1 + R0 ox s

(10.5-13)

En realidad, esta ecuación es un enunciado de la condición de frontera superficial que se debe aplicar a la ecuación de continuidad. Esto se puede expresar convenientemente en la forma -Dp (

iJ(bp)) ---a;-

S=

S.

(bp).

(10.5-14)

en donde

e 1- R 0

S=----.

21

+ R0

(10.5-15)

Los subíndices s indican que las cantidades implicadas se evalúan en la superficie. Por lo general, la constante s se denomina la velocidad de recombinación superficial; su relación con el coeficiente de reflexión más fundamental está dada por (10.5-15). La condición superficial de frontera (10.5-14) se puede expresar en forma vectorial más general como sigue -DP[n • V(bp)].

= s · (bp).,

(10.5-16)

en donde n es un vector unitario saliente, normal a la superficie. Si no existe una recombinación superficial, R 0 = 1 y s =O, de acuerdo con (10.5-5). En este caso, (10.5-14) da o(óp)/ox =O, correspondiente a la condición en que no se tiene un flujo neto difusivo hacia la superficie. Si los portadores se recombinan inevitablemente al llegar a la superficie, Ro =O y s =e /2; evidentemente, este valor es un límite superior para la velocidad de recombinación superficial. No obstante, en este caso restrictivo es muy común hacer que s = oo en (10.5-14), que equivale a hacer que la concentración de portadores en exceso de la superficie (óp)8 sea cero. Se puede demostrar que esta aproximación, que facilita enormemente los cálculos, es apropiada, a condición de que Dp/Lp ~ C/2. Para el germanio a 300°K, DP ~SO cm 2 /seg, e~ 107 cm/seg, y Lp es casi siempre mayor que 10- 3 cm;

Fotoconductividad de estado estacionario

319

por tanto, la condición queda perfectamente satisfecha y este constituye un ejemplo típico. A decir verdad, las circunstancias en las que se viola el requisito se presentan muy raramente y, por tanto, casi siempre se justifica adoptar la condición de frontera s = oo ó (8p )8 = O en el límite superior de la recombinación superficial. Se asignará como ejercicio para el lector, un ejemplo que demuestre con claridad el origen de la condición que se acaba de ver. En todos los casos intermedios en los que la probabilidad de recombinación no es ni cero ni la unidad, se debe usar la condición de frontera de la forma (10.5-14). Todos los cálculos anteriores se desarrollaron en relación con un exceso de huecos en un material tipo n; pero, por supuesto, se pueden aplicar observaciones exactamente iguales a los electrones en exceso en un semiconductor tipo p. En el germanio se pueden obtener coeficientes de reflexión muy elevados (-0.99999) correspondientes a velocidades de recombinación superficial del orden de 100 cm/seg, en muestras cuyas superficies se han preparado mediante un cuidadoso proceso de ataque químico. En muestras cuyas superficies han quedado muy dañadas por pulimento u otra acción abrasiva, existen muchas dislocaciones y otras imperfecciones de red en la superficie que pueden actuar como centros de recombinación. En tal caso, la velocidad de recombinación superficial puede sobrepasar a 105 cm/seg, correspondiendo esto a un valor de menos de 0.99 para el coeficiente de reflexión.15 En el silicio, la velocidad de recombinación superficial es casi siempre mucho mayor en superficies atacadas químicamente, por ejemplo un valor típico sería más o menos 2000 cm¡ seg.

10.6

FOTOCONDUCTIVIDAD DE ESTADO ESTACIONARIO

Para ilustrar la aplicación de algunos de los principiOs que se vieron en las secciones anteriores, se procederá a calcular la respuesta de fotoconductividad en estado estacionario, de una muestra uniforme de semiconductor que se ilumina con una radiación de una longitud de onda lo suficientemente larga que permita ser absorbida sólo ligeramente al pasar por el cristal; pero, al mismo tiempo, lo suficientemente corta para crear una concentración medible de pares electrón-hueco. Por tanto, una longitud de onda apropiada quedará justamente en el lado de las longitudes de onda largas del borde de absorción en la posición A. 1 de la figura 10.l(a). Se supondrá que esta muestra tiene la forma de un sólido rectangular cuyas dimensiones son x 0 , Yo, z 0 , y cuyo espesor x 0 es mucho menor que las otras dimensiones Yo y z0 , y que la iluminación es incidente a lo largo de la dirección x, como se ilustra en la figura 10.11. Las dos superficies grandes de la muestra se han preparado en la misma forma para producir la misma velocidad de recombinación superficial s en ambos lados. Si el coeficiente de absorción es relativamente pequeño, se puede considerar que la intensidad de la luz es más o menos uniforme en todo el cristal. Esto llevará a una velocidad de generación de portadores en exceso g, que es constante y proporcional a la intensidad de la luz. En una muestra larga y delgada del tipo que se ilustra, la concentración de portadores en exceso varía esencialmente sólo en la dirección x, lo cual permite utilizar la fórmula unidimensional de la ecuación de continuidad. Puesto

15 El coeficiente de reflexión Ro casi siempre está muy cerca de la unidad en el caso del germanio y el silicio, incluso en muestras cuyas superficies están muy raspadas. Sin embargo, en muchos casos el efecto de una velocidad de recombinación de lOS cm/seg correspondiente a R 0 = 0.99, se podrá distinguir apenas de la condición en que s = c/L. y R =O.

380 Exceso de portadores en semiconductores Iluminación

jjJ

1

~z/ í0T'' ============~:::::JI \Con~uctor de t:'

,, 1 1 1 '""''"" Iluminación

Figura 10.11.

Geometría del experimento de fotoconductividad que se analizó en la sección 10.6.

que no existen campos en la dirección x y, dado que en la condición de estado estacionario o(f>p )fot = O, la ecuación ( 10.2-26) toma la fonna (10.6-1) en donde g' es constante. Al escribir la ecuación de esta forma, se está suponiendo que se trata de un material extrínseco tipo n y que f>p es pequeña en todas partes en comparación con la densidad de portadores mayoritarios. La solución de esta ecuación se puede expresar como la solución general de la ecuación homogénea (10.3-3) más una solución particular de (10.6-l). Es evidente que f>p =g'L~/Dp =g'rp es justamente una solución particular de (10.6-1) y que la solución general de (10.6-1) se puede escribir como sigue X

bp(x) =A cosh-

LP

X

+ B senh- + g'rP.

(10.6-2)

LP

Debido a la geometría simétrica de la muestra que se ilustra en la figura 10.11, f>p(x) debe ser una función par de x, en donde B =O y (10.6-2) se convierte en

bp(x) =A cosh ~

Lp

+ g'rr

(10.6-3)

Si a esta ecuación se aplica la condición superficial de frontera (10.5-16) en cualquier superficie ( x =

±;o) se puede evaluar la constante A=

-sg'rP x0 D

x0

2LP

2LP

s cosh -

+ ..J!. senh LP

A y

se obtiene (10.6-4)

Fotoconductividad de estado estacionario y

scosh op(x)

= g'tp

[

1-

l

L

. Xp x0 DP x0 s cosh- +- senh2LP LP 2LP

381

(10.6-5)

El perftl de concentración op(x) se ilustra en la figura 10.12(a) para diferentes valores de s. Sp(x)

Lp

Lp

2 (a)

Figura 10.12.

(b)

(
El cambio en la conductancia debido a la presencia de portadores en exceso será proporcional al número total de portadores en exceso que están presentes en la muestra. Si se usa oP para representar el número total de huecos en exceso y oN para la cantidad total de electrones en exceso, entonces,

f

xo/2

oP = oN

= y 0 z0

(10.6-6)

op(x) dx,

-xo/2

en donde y 0 z 0 es el área superficial de la cara iluminada de la muestra. Si se emplea (10.6-5) para representar op(x) en (10.6-6), la integral se puede evaluar fácilmente de tal modo que dé

oP = oN = 2yozog'tp [ Xo-

l

sLPsenh 2L Xo D p • Xo P Xo s cosh- + - senh2LP LP 2LP

(10.6-7)

El elemento diferencial de conductancia entre los electrodos extremos asociados con. una hoja delgada del material, con un espesor dx, está dado por

382

Exceso de portadores en semiconductores de = u(x) da = z0 u(x) dx . Yo Yo

(10.6-8)

Sin embargo, u(x) = u 0

(10.6-9)

+ bu(x) = u 0 + e¡J.Pbp(x)(b + 1),

de donde, de= Zo [u0 + e¡J.p(b Vo

+ 1)<5p(x)] dx.

Al integrar esta ecuación entre los límites x Z

X

Z

e=~ U o + ~ e¡J.p(b Yo Yo

+ 1)

= ± x 0 /2

fxo/2

(10.6-10)

se obtiene

bp(x) dx.

(10.6-11)

-xo/2

No obstante, el primer término anterior es la conductancia de equilibrio área/longitud) en tanto que en el segundo, la integral se puede expresar en función de óP mediante (10.6-6). Haciendo esta substitución en (10.6-11) se puede escribir como

(= a0 •

e= eo

+ epp(b ~ l)bP = Co + i)C.

(10.6-12)

Yo

Entonces, el cambio relativo de conductancia se puede expresar como en donde e0 = uozoxo/Yo, en donde, be e¡J.p(b -=

+ l)(jP

u0 V

óCfe0 •

(10.6-12)

en donde óP está dada por ( 10.6-7) v V = x 0 y 0 z 0 es el volumen de la muestra. En la tigura 10.12(b) se ilustra la fotoconductancia óC/e0 graficada en tunción del espesor de la muestra para diferentes valores de s. Por supuesto, para s =O, la cantidad óP y, por ende, óe es independiente del espesor de la muestra x 0 . Para s >O, la fotoconductancia es muy pequeña en muestras delgadas, ya que en este caso, los portadores se pueden difundir con gran rapidez hasta la superficie y recom· binarse allí. Para muestras más gruesas, los portadores del interior llegan a la superficie sólo después de una gran difusión y la recombinación superficial tiene mucho menos efecto en la conductancia general. En el límite x 0 --+ oo el efecto de la superficie se vuelve insignificante. Es evidente que si las dimensiones de la muestra, Dp, la velocidad de generación g' y una de las cantidades (s, Lp) son factores conocidos, s o Lp, cualquiera que se desconozca, se puede medir en este experimento. Si se usan dos muestras diferentes, idénticas en todo excepto el espesor, se pueden determinar tl'•itO s como LP. La principal dificultad en el uso del efecto de fotoconductividad ..te estado estacionario, como técnica para determinar s o Lp, consiste en conocer la velocidad absoluta de generación g', la cual es difícil determinar en cualquier experimento. Esta dificultad se elimina si, por el contrario, se mide la fotoconductividad transitoria. En la siguiente sección se hace un análisis de este efecto.

Fotoconductividad transitoria 10.7

383

FOTOCONDUCTNIDAD TRANSITORIA; TIEMPO DE VIDA DE LOS PORTADORES EXCEDENTES

En esta sección se estudiará el decaimiento transitorio de la fotoconductividad producida por una radiación penetrante en la muestra, exactamente como la que se vio en la sección anterior. Se supondrá que la fuente de luz ha generado una densidad de portadores p 1 (>p 0 ) que es uniforme en todos los puntos dentro de la muestra en el tiempo t = O, instante en que la radiación de excitación se corta bruscamente. Entonces, ( 10.2-26) describe el decaimiento subsecuente de la distribución de portadores en exceso hasta el estado de equilibrio, descrito por (10.2-26) que, para este caso toma forma o2 (bp) bp(x,t) o(bp) D -------P ox 2 rp ot .

(10.7-1)

Las condiciones de frontera 16 superficiales son o(bp)) -DP ( OX xo/2

= sbp(x 0 /2,t)

y

a(op))

DP (- OX

= sbp( -x 0 /2,t),

(10. 7-2)

-xo/2

además también se requiere que, bp(x,O) = p 1 = const

(10. 7-3)

y

lim bp(x,t) =O.

(10.7-4)

Al hacer la substitución bp(x,t) = e-' 1'Pu(x,t)

(10.7-5)

la ecuación (10.7-1) se puede transformar en una ecuación diferencial para u(x, t) de la forma (10. 7-6)

en tanto que las condiciones de frontera se transforman en

- DP(:~) X

= su(x 0 /2,t); xo/2

DP(~u) uX

=su( -x /2,t) 0

-xo/2

(10.7-7)

y

u(x,O) = p 1 = const

(- X 0

/2 <

X

<

X 0 /2).

(10. 7-8)

16 Aunque para llegar a la forma (1 0.5-16) se supuso una condición de estado estacionario en la condición de frontera, es evidente que esta condición de frontera se puede usar también en situaciones dependientes del tiempo, a condición de que la concentración de portadores de carga en la superficie no cambie mucho en el tiempo requerido para que se establezca el flujo de equilibrio entre la superficie y el volumen. Siempre se supondrá que esta condición se satisface.

384 Exceso de portadores er¡ semiconductores

A continuación se buscarán soluciones producto de la forma u(x,t) = X(x)T(t).

{10.7-9)

Al substituir esta forma para la solución en {10.7-6) se observa que 1

d2X

1

dT

- - - -2 = - - - -- = -a 2 = const. X(x) dx

DPT(t) dt

(10.7-10)

Los dos lados de la ecuación anterior deben ser iguales a una constante, pcr separado, ya que sólo en esta forma puede una sola ecuación de x y una sola ecuación de t ser iguales para todos los valores posibles de x y t. La constante se escribe como -a:2 , de manera que, para cualquier a: real, será negativa; esto es necesario (como se comprobará en breve) para tener la seguridad de que (10.7-4) quede satisfecha. Para la dependencia del tiempo de la ecuación anterior, es obvio que (10.7-11)

de donde {10.7-12)

Para la dependencia espacial, se tiene (10.7-13)

por lo cual X(x)

= A cos ax + B sen ax.

(10.7-14)

Por la simetría del problema, está claro que la dependencia espacial de la concentración de portadores en exceso debe ser siempre una función par de x. Sin embargo, una función sinusoidal o cualquier superposición de funciones sinusoidales, es invariablemente impar en tanto que un coseno o cualquier superposición de cosenos es par. Evidentemente, este requisito físico se puede satisfacer sólo mediante una función coseno o por una superposición de funciones coseno. Por tanto B debe hacerse igual a cero en (10.7-14). De acuerdo con (10.7-9), (10.7-12) y (10.7-14), es obvio que una solución apropiada debe tener la forma u(x,t) =X(x)T(t) = Ae-tz 2 Dpt cos ax.

{10.7-15)

Esta solución por sí sola satisface la ecuación diferencial (10.7-6); pero no satisface las condiciones de frontera (10.7-7) y (10.7-8). No obstante, se puede desarrollar _una superposición lineal de soluciones de esta forma tales que (10.7-16) n

n

que sigue satisfaciendo la ecuacton diferencial, y se está en libertad de seleccionar los valores An y an de tal modo que la superposición satisfaga las condiciones de fron-

Fotoconductividad transitoria

385

tera. En cada ténnino de la suma de (10.7-16), se requiere que se satisfaga la condición de frontera superficial (10.7-17)

entonces, por supuesto, las condiciones de frontera superficiales (1 O. 7-7) quedarán satisfechas automáticamente por dicha superposición. 1 7 Substituyendo una solución de la forma (10.7-15) en lugar de un en (10.7-17), se encuentra que para satisfacer (10.7-17), se debe tener (10.7-18)

de donde, cxn debe escogerse en tal forma que se satisfaga la ecuación ctn CXnXo - - = rxnDp - - = (J.nXo - - (2D 1sx 0 ) 2

S

2

(10.7-19)

P

Las raíces de esta ecuación se pueden obtener numérica o gráficamente como la intersección de las curvas f(cxx 0 )=ctn(+cxxo) y f(cxxo)=(fcxxoX2Dp/sxo), como se oiJustra en la figura 10.13. Ahora se tratará de satisfacer la condición de frontera (10.7-8). Se intentará lograrlo seleccionando valores de An de tal suerte que, en t =O, la suma de todos los valores de Un(X, O) se sumen para formar una representación tipo Fourier del perfil de concentración inicial requerido. Para lograr esto, supóngase que u(x, O) es una función par arbitraria 18 f(x), de tal modo que 00

u(x,O) =

L A" cos cx"x = f(x).

(10.7-20)

n=O

f (ax 0 1

,. a 1x0 -2-

Figura 10.13.

Diagrama que ilustra la determinación de las raíces de (10.7-19) mediante la solución gráfica de la ecuación trascendental.

17 Obsérvese que si u(x, t) es una función par de x, si se da una de las condiciones de frontera, (10.7-7), se da la otra. 18 Si f(x) no fuera par, sería necesario admitir soluciones de la forma Bnexp(- ai,Dpt) sen a,.x en la superposición, junto con la función coseno que se está usando.

386

Exceso de portadores en semiconductores

Si los dos lados de esta ecuación se multiplican por cos OtmX y se integran sobre e! intervalo ( -x0 /2 < x < x 0 /2), el resultado es

Lf n

xo/2 An COS OCnX COS OCmX -xo/2

dx =

fxo/2

j(x) COS

OCmX

dx.

(10.7-21)

-xo/2

Si el conjunto de funciones cos OtnX es ortogonal en el intervalo (- x o /2 < x < x 0 /2), todas las integrales del lado izqUierdo de esta ecuación se desvanecen excepto aquella para la que n = m, que se evalúa con facilidad. En estas circunstancias, al resolver para A m, se puede demostrar que

(10. 7-22)

Esto deja ver que, puesto que se trata de un caso especial del problema de Sturm-Liouville, las funciones {cos ocna} deben formar un conjunto ortogonal. 19 En cualquier caso, no es difícil demostrar directamente que, a condición de que los valores de Otn se escojan de tal manera que satisfagan ( 10.7 -19), las funciones {cos ocna} son ortogonales. Los detalles de esta demostración quedan como ejercicio para el lector. Para el caso presente, se debe escoger f(x) = p 1 =constante y, con esta selección, la integral de (10.7-22) se puede evaluar fácilmente y se obtiene OCnXo

4p 1 sen - 2-

A

=----n OCnXo +Sen OCnXo

(10.7-23)

de donde,

f(x)

= p 1 = 4p 1

(10.7-24)

Ahora se puede encontrar u(x, t) substituyendo el valor anterior para An en (10.7-16) y luego se puede obtener óp(x, t) a partir de (10.7-5). El resultado final es

(10.7-25) Cuando s--* O, la pendiente de la línea recta que aparece en la figura 10.13 se hace extremadamente grande y los valores propios {ocna} tienden a (O, 2rr, 4rr, 6rr ••• Para este conjunto de valores, sen (Otna/2) =O para todos los valores de Otn y todos los términos de la suma de (10.7-25) se desvanecen con la excepción del primero. En el caso del primer término, tanto el numerador como el denominador desaparecen dando origen a una forma indeterminada. Utilizando la regla de L'Hopital se puede demostrar que

r

19 R. V. Churchill, Fourier Series and Boundary Value Problems. Nueva York: McGrawHill (1941), páginas 46-5 2.

Fotoconductividad transitoria

1

ct 0 x 0 sen - 2-

lim

ct x

2cos - 02-0

aoxo~O IXoXo +Sen IXoXo

=

387

1

lim

aoxo~O 1 + COS IXoXo

(10.7-26)

= -,

4

por lo cual,

(10.7-27)

(s = 0).

En la figura 10.14(a) se muestra el perftl de concentración para este caso, graficado para varios valores de t. Es obvio que la concentración sigue siendo la misma en cualquier tiempo dado, en todos los puntos de la muestra. Si s-+ oo, la pendiente de la línea re.:ta de la figura 10.13 tiende a cero y los valores propios {1X"a} tienden a (7T,37T,S7T,77T, ... ) en el límite. En este caso, (10.7-25) se convierte en

(2n oo

bp(x,t) = 4p 1 e-' 1'P

L

( -1)" cos

(2n

n=O

+ 1)rrx x0

+ 1)1!

[ (2 n exp -

+ 1)2 rr zv Pt ] •

2

(10.7-28)

Xo

que es una serie ordinaria de Fourier. En este caso, cuando x = ± x 0 /2, op es cero ya que cos (n + )11 = O. El perfil de concentración para este caso aparece graficado en la figura 10.14(c). Para valores intermedios de s, los valores {a"} deben determinarse numérica o gráficamente y cuando se grafican los resultados, deben producir perftles de concentración como los que se presentan en la figura 10.14(b). La fotoconductancia real se puede obtener a partir de op(x,t) por medio de (10.6-12) y (10.6-6), de acuerdo con lo cual,

+

bC(t) ef.J.p(b + 1) -- = V · y0 z 0

Co

-~ 2

(10.7-29)

bp(x,t) dx,

-xo/2

1=0

1 =O

1=0

,,

t,

t,

/z

lz

13

13

/4

14

o S=O

(a)

Figura 10.14.

ao

fxo/ 2

~ 2

xo

-2

o S>O

(b)

xo

2

Xo

-2

o S=oo

Xo

2

(e)

Perfiles de concentración dentro de la muestra para diferentes valores de t, (a) pata s =O, (b) para s>O, (e) paras= o..>. En todos los casos O< t 1 < tz
388 Exceso de portadores en semiconductores o bien utilizando (10.7-25) y evaluando la integral

Esta expreswn es una suma de los términos, cada uno de los cuales tiene su propia amplitud característica y cada uno de los cuales decae exponencialmente con respecto al tiempo con una constante de tiempo distinta. Esto se puede escribir en la forma (lO. 7-31) en donde Cm es la amplitud del mésimo modo de decaimiento 20 definido por (10.7-30) y en donde cada constante de tiempo exponencial se puede expresar como (10.7-321 Puesto que ao es el miembro más pequeño del conjunto{IX.}, la constante de tiempo T 0 debe ser mayor que cualquiera de las otras; es más, la forma del factor de amplitud Cm que multiplica a cada término es tal que las amplitudes de los términos más altos son más pequeñas que la del primero. m resultado es que los modos de orden más alto desaparecen con mayor rapidez que el de orden cero y. después de un tiempo lo suficientemente largo, el decaimiento se puede representar como una simple exponencial con la única constante de decaimiento del modo principal r 0 , como se ilustra en la figura 10.15. Evidentemente, si el logaritmo de la respuesta fotoconductiva se grafica en función del tiempo, se obtiene una línea recta después que los efectos de los términos de modo más alto de (10.7-30) han desaparecido. La pendiente de esta línea es 1/r 0 , en donde

In

.!f. Co

.. 1

Figura 10.15.

Logaritmo de la respuesta fotoconductiva transitoria en

·ión del tiempo.

20 El subíndice m se adopta aquí para evitar cualquier confusión posible con el tiempo de vida del electrón, T n·

Fotoconductividad transitoria

389

(10.7-33)

Existen dos términos en el lado derecho de esta ecuación; el primero de ellos representa al efecto de la recombinación volumétrica sobre la constante de tiempo del modo principal observado, y el segundo, el efecto de la recombinación superficial. El tiempo de vida observado r 0 es más breve que el tiempo de vida volumétrico real r P a menos que la velocidad de recombinación superficial sea. cero •. en cuyo caso, como ya se indicó antes, a 0 = O. Aunque por lo general es nnpoSible reducir s a cero, de un modo experimental, se puede producir el mismo efecto, como se señala en la figura 10.13, acomodando las condiciones del experimento de tal modo que 2Dp/sx 0 sea mucho menor que la unidad. Esto se puede lograr utilizando una muestra muy gruesa. En estas condiciones, los portadores generados en el interior deben difundirse una distancia mayor hasta la superficie, cuyo papel es mucho menos importante que en una muestra delgada, y el tiempo de vida observado r 0 se aproxima al tiempo de vida volumétrico rea! r P. Si se conocen los tiempos de vida volumétrico real r P y el de vida observado, la velocidad de recombinación en la superficie se puede evaluar resolviendo (1 O. 7-33) para a 0 , insertando el valor obtenido en (10.7-19) y despejando s. El resultado es

(10.7-34)

Esta fórmula también se puede usar para obtener el tiempo de vida volumétrico real, si se conocen el tiempo de vida observado y la velocidad de recombinación superficial. Si se desconocen inicialmente tanto r P como s, se pueden determinar trabajando primero con una muestra gruesa cuya superficie se trata en tal forma que se minimice la recombinación superficial; el decaimiento fotoconductivo transitorio asociado con este tipo de muestra se aproximará a rP. A continuación, la muestra gruesa se puede cortar en otras más delgadas y las superficies de éstas se deben tratar a fin de obtener las condiciones apropiadas para medir la velocidad de recombinación superficial. La constante de decaimiento r 0 se mide entonces, y s se saca directamente de ( 10.7-34) empleando el valor de r P obtenido previamente. Otra posibilidad es cortar dos muestras de diferentes espesores de un material con un tiempo de vida uniforme. Las superficies de las dos muestras se tratan de tal modo que se obtengan las condiciones en las que se desea hacer la medición de s, y se determine el tiempo de vida observado relacionado con cada muestra. Después, la ecuación (10.7-34) se puede escribir para cada muestra y las dos ecuaciones se resuelven numéricamente para las dos cantidades desconocidas r P y s. Un tercer método consiste en utilizar sólo una muestra y ajustar los valores de r P y s en ( 10.7-30) de tal manera que se reproduzca no sólo la constante de tiempo del modo principal observado r 0 (que, después de todo se puede obtener en otras combinaciones diferentes de r P y s), sino también el patrón de decaimiento inicial del modo más alto que se observó. Aunque el análisis matemático requerido es complejo, este método tiene la ventaja de que emplea una sola muestra y con esto se minimizan las dificultades que producen las heterogeneidades en el tiempo de vida volumétrico y las velocidades de recombinación superficial.

390 Exceso de portadores en semiconductores

10.8

MECANISMOS DE RECOMBINACION; LA TEORIA DE RECOMBINACION DE SHOCKLEY-READ

En esta sección se investigarán brevemente los aspectos físicos de la recombinación electrón-hueco. Es importante comprender los procesos físicos asociados con !a recombinación directa de electrón-hueco, así como en la recombinación por atrapamiento, aunque se ha descubierto que esta última es el mecanismo dominante en la mayoría de las situaciones relacionadas con semiconductores covalentes o intermetálicos lii- V. En la recombinación directa, un electrón de la banda de conducción y un hueco de la de valencia se recombinan sin la participación de ningún estado intermedio. Si las bandas de conducción y valencia tienen separación mínima de energía en k = O, entonces es posible que se produzcan transiciones verticales en las que un electrón cercano a la parte superior de la banda de valencia puede recombinarse con un hueco que está cerca de la base de la banda de conducción. Puesto que en d~cha transición se debe conservar la cantidad de movimiento, sólo los electrones y los huecos cuyos vectores k satisfacen la relación (10.8-1) pueden interactuar de esta manera. En el proceso se emite 21 un fotón cuya frecuencia w está dada por (10.8-21

En la figura 10.16(a) se ilustra este proceso de transición directa. La absorción de un fotón acompañada de la producción de un par electrón-hueco, se puede llevar a cabo mediante un proceso que es precisamente la inversa de éste. En substancias tales como el germanio y el silicio, en donde el mínimo de la banda de conducción ocurre a un valor de la cantidad de movimiento del cristal k 0 que no es cero, la recombinación de un electrón en el mínimo de la banda de conducción y un hueco en la parte superior de la banda de valencia, requiere (además de la producción de un fotón) la emisión de un fonón con una constante de propagación k'= k 0 o la absorción de un fonón ya presente con una constante de propagación k' = -k 0 , para que pueda conservarse la cantidad de movimiento del cristal. Este es el proceso que se conoce con el nombre de transición indirecta. La energía que hubiera portado el fotón en una transición directa, es ahora el fonón el que la lleva (o la proporciona). La frecuencia de la radiación asociada con este tipo de transiciones está dada por (10.8-31

en donde e' (k0 ) es la energía asociada con un fonón cuyo número de onda es k 0 • según se obtuvo de la relación de dispersión w(k) para las vibraciones de red, como sigue, s'(k 0 ) = hw(k 0 ).

(10.8-4)

21 En (10.8-1), la cantidad de movimiento que se lleva el fotón emitido se ha desechado Esto se justifica debido a que la longitud de onda del electrón (para una energía promedio kn. como lo señala la expresión (8.4-1), es mucho menor que la longitud de onda del fotón para w ~ .t.E/h. Por supuesto, las cantidades de movimiento están asociadas con la longitud de onda respectiva por medio de la relación de De Broglie, (4.9-7).

Mecanismos de recombinación; la teoría de Shockley-Read

391

-k

-k

(a)

Figura 10.16.

(b)

Recombinación electrón-hueco a través de (a} una transición directa y (b} una transición indirecta.

Aunque la energía e'(k0 ), es pequeña en comparac10n con la energía de la banda prohibida, !!.e, es perceptible a través de su influencia en la forma de la curva de absorción, en función de la longitud de onda cerca del borde de absorción. También en este caso, la absorción de un fonón para producir un par electrón-hueco se puede considerar como la inversa de este proceso. En realidad, puesto que el fonón emitido o absorbido puede pertenecer a la rama acústica o a la óptica y también puede ser de una vibración transversal o longitudinal, existen cuatro fonones separados que pueden participar en dicho proceso, cada uno de los cuales poset> una frecuencia diferente y, por ende, una energía e' distinta para k= k 0 . Los efectos de los cuatro fonones se pueden observar en los espectros de absorción de esta naturaleza del semiconductor, cerca del borde fundamental de absorción. Por supuesto, las transiciones directas también se pueden producir en materiales en donde el mínimo de la banda de conducción no está en k = O; pero sí es apreciable la diferencia de energía en el borde de la banda de conducción, entre el punto de energía mínima y k = O, la población de electrones para energías correspondientes a k = O será normalmente tan pequeña que tales transiciones son muy poco frecuentes. Del mismo modo, las transiciones directas de absorción requerirán energías del fotón incidente que sean mucho mayores que las que se necesitan para promover las transiciones indirectas. En condiciones normales, las transiciones indirectas son predominantes en todo los semiconductores elementales covalentes y los semiconductores de compuesto de los grupos III y V con la sola excepción de InSb, en el que el mínimo y el máximo de las bandas de conducción y valencia, están en k = O. En cualquier caso, se puede calcular la velocidad a la que se producen las transiciones del espectro óptico de absorción observado del material22 y, por tanto, inferir la velocidad de recombinación y el tiempo de vida de los portadores en 22 En el estado estacionario, las velocidades de generación y recombinación de los pares electrón-hueco deben ser iguales; por esta razón, el cálculo de la velocidad de generación deberá dar también la velocidad de recombinación. Sin embargo, para los pares electrón-hueco producidos por una excitación óptica directa, la velocidad de generación para cualquier longitud de onda de fotón incidente debe ser proporcional al coeficiente de absorción para dicha longitud de onda. La curva de absorción óptica y la velocidad de recombinación originadas en procesos de recombinación directa, entonces están íntimamente relacionadas.

392

Exceso de portadores en semiconductores

exceso, basándose en el espectro de absorción. Van Roosbroeck y Shockley23 fueron los primeros en efectuar este cálculo y encontraron que, por ejemplo, en el germanio, el tiempo de vida de los portadores en exceso a la temperatura ambiente, debe ser aproximadamente 0.75 seg, independienten1ente de la densidad de impurezas donadoras y receptoras. Las evidencias experimentales contradijeron este resultado; los tiempos de vida observados de los portadores en exceso raramente excedieron 1o- 3 seg, y se encontró que eran muy sensibles a la concentración de impurezas don'ldoras o receptoras. También quedó bien establecido en la práctica, que los tiempos de vida de los portadores en exceso en el germanio y el silicio se podían reducir drásticamente introduciendo ciertas impurezas, por ejemplo, el cobre, en concentraciones muy pequeñas y mediante la introducción de ciertas imperfecciones estructurales, por ejemplo, dislocaciones. Además, el cálculo de Van Roosbroeck-Shockley predijo la dependencia del tiempo de vida de los portadores en exceso en función de la temperatura, lo cual no se observó experimentalmente. Se demostró que en casi todos los materiales, los tiempos de vida de los portadores en exceso no se veían limitados por las transiciones radiactivas del tipo que se vio antes, sino más bien por algún otro proceso íntimamente relacionado con la presencia de ciertos tipos especiales de átomos de impurezas e imperfecciones estructurales en pequeñas concentraciones. Estos resultados hicieron que se estudiara la recombinación por el atrapamiento de electrones y huecos a través de niveles de energía localizados que se ubican en la parte profunda dentro de la banda de energía prohibida y que se pensó estaban asociados con ciertas impurezas y defectos estructurales "de atraparniento ··. Shockley y Read 24 fueron los primeros en investigar este mecanismo. La teoría Shockley-Read de la recombinación incluye un estudio de las estadísticas de ocupación de dichos niveles de atrapamiento. Aquí se verá detalladamente el comportamiento de un nivel de energía a una energía er dentro de la región de energía prohibida, que es neutra cuando está vacía y que puede ocuparla cualquier electrón, adquiriendo con ello una carga negativa. Estas trampas pueden promover la recombinación electrón-hueco, capturando electrones de la banda de conducción y transfiriéndolos subsecuentemente a la de valencia, siempre que aparezca un hueco cerca de la trampa para recombinarse con el electrón atrapado. El efecto neto es desaparecer el par electrón-hueco con lo que el nivel de atrapamiento vuelve finalmente a su estado original. Puesto que el centro de atrapamiento está casi siempre acoplado de un modo firme a la red, la energía y la cantidad de movimiento que pertenecieron inicialmente al electrón y al hueco pueden convertirse en vibraciones de red. En este proceso se emite muy poca o ninguna energía electromagnética. Existen cuatro pro-

::T T _l_ T Ev

(o)

Figura 10.17.

23 24

( b)

+

+

(e)

(d)

Cuatro procesos fundamentales comprendidos en la recombinación por medio de trampas; (a) la capt,ua de un electrón de conducción hecha por una trampa vacía, (b) la emisión de un electrón desde la trampa hasta la banda de conducción, (e) la captura de un hueco de la banda de valencia efectuada por una trampa que contiene un electrón y (d) la promoción de un electrón de valenc~a a una trampa inicialmente vacía.

W. van Roosbroeck y W. Shockley, Phys. Rev., 94, 1558 (1954). W. Shockley y W. T. Read, Jr., Phys. Rev.• 87, 835 (1952).

Mecanismos de recombinación; la teoría de Shockley-Read

393

cesos básicos comprendidos en la recombinación electrón-hueco a través de los centros de atrapamiento, como se ilustra en la figura 10.17: (a) la captura de un electrón de la banda de conducción que realiza una trampa vacía inicialmente neutra, (b) la inversa de (a), incluyendo la emisión de un electrón que ocupaba en un principio un nivel de atrapamiento, a la banda de conducción, (e) la captura de un hueco en la banda de valencia realizada por una trampa que contiene un electrón y (d) la inversa de (e)_ en donde se promueve un electrón de valencia hacia una trampa inicialmente vacía (esto también puede considerarse como la emisión de un hueco desde la trampa hasta la banda de valencia). En estas circunstancias, la velocidad a la que los electrones de la banda de conducción son capturados por las trampas, es claramente proporcional al número de electrones de la banda de conducción y a la cantidad de trampas vacías disponibles para recibirlos. Esto se puede escribir como sigue (10.8-5) en donde Cn es una constante y Nt representa la concentración total de centros de atrapamiento en el cristal. Del mismo modo, la velocidad a la que los electrones se emiten desde trampas llenas hasta la banda de conducción, será proporcional al número de trampas llenas y, por tanto, se puede expresar como (10.8-6) en donde En es otra constante de proporcionalidad. De acuerdo con el principio del balance detallado, en el estado de equilibrio estas dos velocidades deben ser iguales, de donde, (10.8-7) Al substituir en esta expresión el valor explícito de la función de Fermi fo de (5.5-20), se obtiene la relación muy simple (10.8-8) Si se substituye el valor dado por (9.3-6) para n 0 , (10.8-8) se puede escribir, finalmente, como (10.8-9) en donde (10.8-10) Al escribir (10.8-9) y (10.8-10), se está suponiendo que la distribución de electrones en la banda de conducción es de tipo maxwelliano. La cantidad n 1 es la concentración de electrones que estaría presente en la banda de conducción, si el nivel de Fermi coincidiera con el nivel de atrapamiento €t. La velocidad neta a la que se capturan los electrones de la banda de conducción es sólo la diferencia entre (10.8-5) y (10.8-6) que, usando (10.8-9) para expresar En en función de Cn, es (10.8-11)

394

Exceso de portadores en semiconductores

Así también, la velocidad a la que se capturan los huecos de la banda de valencia debe ser proporcional a la concentración de huecos y al número de trampas que pueden recibir huecos (y, por ende, la cantidad que está ocupada por electrones) entonces (10.8-12) La velocidad a la que los huecos se emiten a la banda de valencia desde los centros de atrapamiento [proceso ( d) de la figura 10.17] es proporcional a la cantidad de trampas ocupadas por huecos (es decir, vacías), de acuerdo con lo cual (10.8-13) Igual que antes, en el estado de equilibrio, Rcp debe ser igual a Rep y razonar1do de un modo análogo a como se hizo al derivar (10.8-9), se puede demostrar que (10.8-14) en donde, (10.8-15) Nuevamente, p 1 puede considerarse como la concentración de huecos que se encontraría en la banda de valencia si el nivel de Fermi se localizara en la energía del nivel de atrapamiento. La velocidad neta a la que los huecos se capturan desde la banda de valencia se puede expresar como (10.8-16) Cuando hay centros de atrapamiento presentes, ya no es posible normalmente suponer que 8n = 8p, a pesar de que se mantiene la neutralidad eléctrica general. debido a que algunos electrones, que de otra manera estarían presentes en la banda de conducción como parte de 8n, ahora pueden estar inmovilizados en las trampas. incapaces de funcionar como electrones de conducción. Esta situación origina ciertas dificultades cuando la densidad de los centros de atrapamiento es grande, y Shockley y Read analizaron esta situación detalladamente. No obstante, si NP es muy pequeño, la aproximación 8n = 8p sigue siendo aceptable. 25 Se supondrá que este es el caso, y en la mayoría de las condiciones de interés práctico en semiconductores covalentes este requisito se satisface. En una muestra en la que los portadores en exceso se recombinan en estas condiciones, se debe tener Rp = Rn, ya que cada recombinación de electrón va acompañada de la recombinación de un hueco. La velocidad común de recombinación se relaciona con eJ tiempo de vida r por medio de (10.8-17) Si se iguala (10.8-11) a (10.8-16) y se resuelve para f(e 1 ), se obtiene (10.8-18) 25 Shockley y Read demostraron que 8n ~8p siempre que cualquiera de las cuatro cantidades, no, Po, n¡ y p¡ sea grande en comparación con N.

Mecanismos de recombinación; la teoría de Shockley-Read niPI

395

Al substituir este valor ya sea en (10.8-11) o en (10.8-16) y observando que es evidente que

= nl,

(10.8-19) Si ahora se escriben = n 0 en la forma

1

+ 8p, p =Po + 8p,

la ecuación anterior se puede exp1

N,(Po + no + ~P) 1 -(no+ n¡ + ~p) +e (Po+ PI+ ~p) 1

ep

En el límite en que n 0

~ar

(10.8-20)

n

~8p,

p 0 , ni, PI es evidente que (10.8-20) se reduce a

= tpo =e

t

1 N . p

(10.8-21)

t

El tiempo de vida de los huecos en una muestra tipo n fuertemente extrínseca que tiene una concentración de centros de atrapamiento específica, es justamente el recíproco de epNt· De igual manera, en el límite en que Po ~ 8p, n0 , nI, pI, (10.8-20) se reduce a

1

t

(10.8-22)

= tno =en N t

comprobando que en una muestra tipo p fuertemente extrínseca, el tiempo de vida del electrón es el recíproco de CnNt. Por tanto, (10.8-20) se puede escribir como sigue

Po+ no+ ~p

(10.8-23)

en donde (rpo, Tno) representa el tiempo de vida del exceso (huecos electrones) en un material fuertemente extrínseco (tipo n o p) que tiene las características de atrapamiento particulares que se están tomando en cuenta. El tiempo de vida para materiales intermedios entre estos dos extremos está dado por (1 0.8-23). Para valores pequeños de 8p (10.8-23) puede escribirse como

_ (no t-tpo

+ n¡)

Po+ no

+tno (Po

+PI) .

Po+ no

(10.8-24)

De acuerdo con esta ecuación, el tiempo de vida se puede graficar en función del nivel de Fermi y, por tanto, como una función de n 0 y p 0 • Se ha encontrado que el tiempo de vida es un máximo cuando el nivel de Fermi se encuentra en algún punto dentro de la banda prohibida, cuya ubicación exacta depende de los valores de Tpo, Tno y ni, como se muestra en la figura 10.18. Si Tno y Tpo son iguales, el máximo se producirá en la condición intrínseca. La variación del tiempo de vida con el nivel de inyección 8p se puede estudiar resolviendo (10.8-23) para r, escribiendo el resultado en la forma

396

Exceso de portadores en semiconductores

lu

J Tpo

Ev



Et

Ee

Ef-

Figura 10.18.

La dependencia del tiempo de vida en función de la energía de Fermi, como lo predice la teoría Shockley-Read.

(10.8-25)

en donde (10.8-26) De acuerdo con esto, se observa que si lip es lo suficientemente pequeña, el tiempo de vida tendrá el valor T 0 independiente de lip. Para valores más grandes de lip, el tiempo de vida depende de lip y puede aumentar o disminuir con valores crecientes de lip dependiendo de los valores relativos de T po. T n 0 , n 0 y n 1. Para valores grandes de lip, se puede ver que (10.8-25) da (10.8-27) Si T _ es diferente de To (como sucede casi siempre), existe una vanac10n monotónica del tiempo de vida entre los límites T 0 y T _ conforme aumenta lip. Es difícil establecer comparaciones precisas y significativas entre la teoría de Shockley- Read y el experimento, debido a la dificultad que representa obtener muestras con concentraciones controladas con precisión de un solo tipo de centros de atrapamiento y también debido al número de parámetros desconocidos cuyo valor se debe determinar (o ajustar para que sean apropiados) de los datos experimentales. 26 Sin embargo, la teoría parece coincidir con todos los resultados experimentales a los que puede esperarse sean aplicables hasta la fecha. 27 Explica las variaciones notables observadas del tiempo de vida de los portadores en función de la densidad de los donadores y los receptores, el nivel de inyección, la concentración de los centros de atrapamiento y la temperatura. También puede ampliarse para 26 La dificultad consiste no tanto en ajustar los datos experimentales, sino en que se cuenta con muchos parámetros ajustables que los datos pueden explicar mediante muchos conjuntos posibles de valores para estos parámetros. 27 Véase, por ejemplo, J. A. Burton y colaboradores, J. Phys. Chem., 57, 853 (1964).

Mecanismos de recombinación; kl teoría de Shockley-Read

397

In 8C

Co

Fase normal

Atrapamiento lento

_, Figura 10.19.

Respuec .otoconductiva transitoria de una muestra que contiene gran número de "centros de atrapamiento lento".

ofrecer una teoría de la recombinación superficial basada en los niveles de atrapamiento asociados con la superficie; pero teniendo propiedades similares a las de los centros volumétricos que se vieron hasta ahora en lo que respecta a las estadísticas de captura y emisión. Desde el punto de vista físico, los centros volumétricos de atrapamiento de los cristales semiconductores se producen a menudo debido a la presencia de ciertas '"impurezas de atrapamiento". En semiconductores covalentes, tales como el silicio y el germanio, estas impurezas de atrapamiento con frecuencia son dobles receptores divalentes, por ejemplo, Cu y Ni, que proporcionan un nivel receptor ordinario muy cercano a la banda de valencia- y un segundo nivel profundo dentro de la región prohibida que se ioniza con mucha menos fa, tlidad y que funciona como un nivel de atrapamiento. Los niveles donador y receptor originados por la presencia de impurezas de substitución III y V se ionizan casi por completo a todas las temperaturas, excepto las muy bajas y, por ende, usualmente no desempeñan un papel importante en los procesos de recombinación. 28 La presencia de imperfecciones estructurales, sobre todo dislocaciones tipo de borde, han demostrado que también producen niveles receptores de atrapamiento dentro de la región prohibida que en muchos casos proporcionan una contribución importante a la recombinación electrón-hueco. A veces sucede que en una misma muestra estan presentes dos tipos distintos de centros de atrapamiento. Por lo general, uno de éstos es el centro normal de recombinación, como se vio antes; sin embargo, el segundo conjunto de centros de atrapamiento con frecuencia se asocia con una probabilidad de captura de huecos muy reducida cuando está lleno de electrones. Esto conduce a un valor muy grande de r P 0 para esos niveles. Aunque naturalmente se de be repetir el análisis de Schockley · Read, tomando en cuenta desde el principio los dos conjuntos de niveles de atrapa· miento, para describir los detalles de la situación resultante, se ve fácilmente de un modo intuitivo que lo que debe suceder en principio en una medición de fotoconductividad transitoria como la que se vio en la sección 1O. 7, es que algunos electrones se recombinan a través de los niveles normales de recombinación, en tanto que otros caen dentro del segundo grupo de trampas. No obstante, en muy poco tiempo, el proceso de recombinación normal termina con todo el exceso de electrones, excepto con los que quedaron en el segundo grupo lento de trampas que, a continuación, capturan con lentitud el exceso restante de huecos. El decaimiento de fotocon28

Excepto, por supuesto, en lo que pueden influir en la posición del nivel de Fermi.

398

Exceso de portadores en semiconductores

ductividad resultante tiene dos secciones exponenciales separadas, con diferentes constantes de tiempo, como se puede ver en la figura 10.19. Existe una fase de recombinación inicial "normal" y una gran "cola de atrapamiento" debida a las trampas lentas. A veces se presenta una confusión en lo que respecta a la termin~ logia relacionada con este efecto, en el sentido de que la parte inicial "normal" del decaimiento se cita a menudo como "recombinación" y el decaimiento final lento se describe como "de atrapamiento". En realidad, las dos fases del proceso están gober· nadas por el fenómeno de atrapamiento y es más exacto citar al primero com: debido al atrapamiento normal y el segundo a efectos del atrapamiento lento. EJERCICIOS l. Principiando con la ecuación de Boltzmann y suponiendo que se aplica la aproximacié>:t del tiempo de relajación, demuestre que en un sistema de estado estacionario que contien: partículas libres en el que existe un gradiente de concentración en la dirección z, se establece w: flujo de difusión - D(fm/6x). Demuestre que el coeficiente de difusión D es igual a 'llc/3 en donlk 'A es la trayectoria libre media y es la velocidad térmica media. Puede suponerse que b. trayectoria libre media A es independiente de la velocidad y que el sistema obedece a la estadir tica de Maxwell-Boltzmann en equilibrio. Nota: suponga que la función de distribución /(r, v) ;.e puede escribir en la forma n(r).f(v); esto es razonable si la desviación del estado de equilibrio 1!-' es muy marcada. 2. Los resultados derivados de los cálculos del problema 1 se aplicaron en el texto a sistemas de estado no estacionario al igual que a sistemas que conservan dicho estado. Explique (cualitativamente) en qué circunstancias es permisible esta aplicación. 3. Demuestre que si f(x, t) satisface la ecuación diferencial

e

n a'J- [- g[ ax' T -a( entonces, .f(~. t)(~ = x - IJEot, en donde E o =constante) debe ser la solución de

D

az¡ ax' -

¡LEo

a¡ f ax - ~



=

a, .

4. Se crea una distribución de portadores en exceso de estado estacionario en una muestn extrínseca tipo n, por medio de una fuente plana de generación en el origen. La difuSIÓ• resultante y el arrastre de la distribución de los portadores se puede considerar de tipo unidr mensional a lo largo de la dirección x; la extensión de la muestra en la dirección x es esencialmente infinita. Se tiene también un campo eléctrico constante E 0 en la dirección +x. u densidad de portadores en exceso se mide determinando la corriente inversa de saturación en dOi puntas de prueba en lugares diferentes, x =a y x = b(b >a). Se desea calcular la longitud de difusión Lp a partir de la relación de estas dos densidades medidas de los portadores en exceso. Demuestre que

J (

d

In Ko In Ko

d) + eE kT 0

en donde Ko =8p(a)/8p(b) y d =b- a. 5. Principiando con la solución (10.3-32) de la ecuacton de continuidad y definiendo el tiempo de tránsito como el lapso en el que el trazo del osciloscopio llega a un máximo, derive los resultados indicados en (10.4-3) y (10.4-4). 6. Estudie un semiconductor uniforme semiinfinito cuya superficie coincide con el plano yz. El material posee un tiempo de vida volumétrico de portadores en exceso T y existe una velocidad de recombinación superficial s asociada con la superficie. También se tiene una velocidad de generación volumétrica uniforme y constante de portadores en exceso g' en todos los puntos de la muestra. Suponiendo que se ha llegado a un estado estacionario, calcule la densidad de portadores en exceso 8p(x) en todos los puntos dentro de la muestra.

Lecturas recomendadas 399 7. De acuerdo con los resultados del problema 6, demuestre que, a condición de que D/L <;¡¡; /2 (D =coeficiente de difusión, L =(DT) 1 /2 =longitud de difusión) no se registra una gran diferencia en la concentración de portadores dentro del volumen o en el flujo difusivo de portadores hacia la superficie, ya sea que s se considere como C/2 o infinito. Demuestre que esta condición se puede representar también en la forma L ~-p 8. Demuestre explícitamente que el conjunto de funciones :cos a.a} con an según la define (10.7-19), es ortogonal. Encuentre la constante de normalización ya derivada (10.7-22). 9. La constante de decaimiento fotoconductiva observada, relacionada con una muestra muy gruesa de germanio tipo n(/)0 = 45 cm 2 /seg, f.4, = 1800 cm2 /V- seg) en 500 ¡Jseg. La muestra se corta en capas de 0.1 cm de espesor, las superficies se atacan químicamente y luego se observa que la constante de decaimiento fotoconductiva es 300 ¡Jseg. ¿Cuál es la velocidad de recombinación superficial asociada con las superficies atacadas químicamente de las muestras delgadas? 10. De acuerdo con los resultados de la teoría de Schockley-Read para un material con centros de atrapamiento para los que T no = T po demuestre que el máximo tiempo de vida posible se produce cuando e¡ está en el punto intrínseco y que, en estas circunstancias, el tiempo de vida está dado por

.

[

e-e,]

T=T•o 1 +cosh~

en donde €¡ es la posición del nivel de Fermi para la condición intrínseca. 11. Explique la variación del tiempo de vida e-n función del nivel de inyección Dp para un material en el que TpO = T no y en donde €t = €v +~. de acuerdo con la teoría Shockley-Read 12. De acuerdo con los resultados y las técnicas desarrolladas en la sección 10.5, demuestre que la constante numérica a de las ecuaciones (10.5-8) y (10.5-9) debe tener el valor 3/2. 13. A veces se indica que, puesto que el flujo en equilibrio de partículas a través de un plano, en una distribución de Boltzmann, es pC/4, la máxima velocidad de recombinación superficial que puede obtenerse (asociada con una superficie de un coeficiente de reflexión igual a cero) debe ser s =C/4. La expresión (10.5-15) contradice esta conclusión y predice que el máximo valor que se puede obtener para s es c/2. Señale el error físico de este argumento Y demuestre que el valor C/2 dado por (10.5-15) es el realmente esperado desde el punto de vista físico. 14. Considete una barra de germanio extrínseco tipo n con una sección transversal constante, que se extiende a lo largo del eje x. Se hace fluir una corriente constante en la dirección x positiva conectando una batería a los extremos de la muestra. Se crea una densidad uniforme de pares electrón-hueco en exceso en t =O, dentro de la región 1 2 • Esta distribución de portadores en exceso sufre un arrastre con una velocidad J.LpE 0 en la dirección positiva de x, de acuerdo con los resultados de la sección 10.2. Utilice sólo argumentos físicos para explicar por qué la dist•ihución de portadores en exceso se desplaza a la derecha a lo largo del eje + x, a pesar de que los electrones en exceso dentro de la distribución deben estarse moviendo hacia la izquierda dentro del campo aplicado. Haga un diagrama que demuestre (esquemáticamente) el campo interno y la densidad de carga espacial que lo produce. Puede suponer que el tiempo de vida volumétrico de portadores en exceso es infinito, que la velocidad de recombinación superficial es cero y que la densidad de portadores en exceso es pequeña en comparación con la densidad de portadores mayoritarios en equilibrio. Nota: principie observando que, debido a la constancia de la densidad de corriente a lo largo de la muestra y la modulación de la conductividad por los portadores en exceso, el campo eléctrico debe ser más pequeño dentro del pulso de portadores en exceso que fuera de él.

x <x <x

LECTURAS RECOMENDADAS A. Many y R. Bray, "Lifetime of Excess Carriers in Semiconductors," in Progress in Semiconductors, Heywood and Co., Londres (1958), Vol 3, pp. 117-151. Allen Nussbaum, Semiconductor Device Physics, Prentice-Hall, Inc., Englewood Cliffs, N.J. (1962). W. Shockley, Electr0'1S and Hales in Semiconductors, D. Van Nostrand Company, Inc., Nueva York (1950) R. A. Smith, Semiconductors, Cambridge University Press, Londres (1961). E. Spenke, Electronic Semiconductors, McGraw-Hill Book Co., Inc., Nueva York (1958).

CAPITUW

11

Tecnología de materiales y medición de propiedades volumétricas 11.1

PREPARACION DE LOS MATERIALES SEMICONDUCTORES DE ALTO GRADO DE PUREZA

En los capítulos anteriores se dijo muy poco respecto a las técnicas químicas y metalúrgicas relacionadas con la preparación de las substancias semiconductoras de alto grado de pureza. De igual manera, aunque ya se examinaron con cierto detalle las propiedades eléctricas de los semiconductores, casi no se han analizado las técnicas experimentales que se utilizan para medir dichas propiedades. En este capítulo se intentará remediar estas deficiencias aunque, puesto que el propósito principal es comprender la física de los semic~mductores, será necesario limitarse a un estudio cualitativo, o cuando mucho, semicuantitativo de los aspectos químicos y metalúrgicos de la tecnología de materiales. Se ha demostrado que gran número de substancias presentan las propiedades características asociadas con los semiconductores, los elementos covalentes tales como el germanio y el silicio son los más conocidos, los que se comprenden más a fondo y los que se utilizan más profusamente en la tecnología de dispositivos. Porque entre todas las substancias semiconductoras, éstas son las que se preparan con mayor facilidad en forma de cristales únicos de ultra alta pureza, libres de dislocaciones, vacantes de red y otras imperfecciones estructurales. Los otros semiconductores cavalentes pertenecientes al grupo IV de la tabla periódica, el diamante y el estaño a (gris), son muy difíciles de obtener en forma de cristales únicos grandes de alta pureza y, por tanto, no se han estudiado tan minuciosamente desde el punto de vista fundamental, ni se han utilizado en absoluto en la tecnología de dispositivos electrónicos. Los compuestos intermetálicos que se forman entre los elementos del grupo Ili y el grupo V de la tabla pt:riódica, tales como InSb, GaAs, AIP, etc., cristalizan con la estructura de la zincblenda y forman una serie de materiales semiconductores cuyas propiedades físicas son muy semejantes, en muchos aspectos a las de los elementos covalentes del grupo IV. No obstante, estos semiconductores III-V tienen una naturaleza ligeramente fónica, lo que explica la mayoría de las diferencias en las propiedades de los compuestos Ili-V y las de los semiconductores covalentes del grupo IV. La masa efectiva de los electrones de conducción en los compuestos lli-V por lo general es muy pequeña en comparación con la masa gravitacional m0 , en tanto que la masa efectiva de huecos no es muy diferente de la gravitacional del electrón. Por esta razón, de acuerdo con (9.7-7) y (9.11-19), la movilidad de elec· trones en muestras puras de estos compuestos será muy alta, como también lo será la relación de movilidad b. En el InSb, en donde este fenómeno es más pronun 401

402

Tecnología de materiales y medición de propiedades volumétricas

ciado, se observan valores de movilidad electrónica que sobrepasan a 50,000 cm2 /V-seg y relaciones de movilidad de casi 100, a la temperatura ambiente. Desafortunadamente, debido a la probabilidad relativamente alta de recombinación radiactiva y a la dificultad de producir cristales de tales substancias que estén libres de impurezas de atrapamiento e imperfecciones estructurales, los tiempos de vida de los portadores en exceso en estos materiales son muy cortos (I0- 7 seg o menos) y los efectos de los portadores en exceso se pueden observar con extrema dificultad. Las bandas de energía prohibidas asociadas con los diferentes compuestos intermetálicos III-V aumentan al reducirse las masas atómicas de los elementos constituyentes, en la misma forma en que las bandas de energía prohibida de los semiconductores del grupo IV aumentan al ir de Sn a pasando por Ge y Si hasta el diamante. En consecuencia, InSb, al igual que Sn a, tiene una banda de energía prohibida muy pequeña, en tanto que InAs, GaSb, GaAs, GaP y AlP tienen, sucesivamente, mayores anchuras en esa banda. En general, cualquier compuesto III-V tendrá cierta semejanza con el semiconductor del grupo IV ubicado en la tabla periódica a la mitad de la línea que une a los dos constit¡¡yentes del compuesto III-V. Las propiedades características de los compuestos III-V fueron analizadas por Seraphin 1 empleando un ingenioso modelo unidimensional (similar al que se usó en el cálculo de KronigPenney) que permite una solución exacta a la ecuación de Schrodinger. A pesar de las desventajas asociadas con los tiempos de vida muy reducidos de los portadores ~ las dificultades de la preparación de cristales únicos de alta pureza, los compuestos semiconductores III-V se han usado en gran variedad de aplicaciones técnicas, sobre todo cuando la alta movilidad electrónica constituye una ventaja. Además de estas substancias, el carburo de ~Ilicio (SiC), ciertos compuestos 11-VI tales como CdS, CdSe, CdTe, ZnS, PbS, PbSe, PbTe, ciertos óxidos metálicos ~ aun varias substancias orgánicas cristalinas tales como el antraceno, son semiconductores bien conocidos. Sin embargo, con la excepción del carburo de silicio y. quizás el sulfuro de cadmio, la importancia tecnológica de estos mllteriales ha sido muy pequeña, por lo que este estudio se referirá principalmente a los elementos cavalentes del grupo IV y a los compuestos intermetálicos III-V. El material inicial para la preparación de germanio de alta pureza es dióxido de germanio químicamente puro que se obtiene como un subproducto de la fundición y la refinación del zinc. Este material, que se presenta casi siempre en 1::. forma de un polvo blanco finamente dividido, se coloca en crisoles de grafito de alta pureza y se reduce a germanio calentándolo entre 600 y 900°C en una corriente de hidrógeno. La reacción se desarrolla de acuerdo con la ecuación

Después de varias horas, el germanio se obtiene en la forma de un polvo negro finamente dividido que se funde en una barra larga y angosta de germanio policristalino, elevando la temperatura por encima del punto de fusión, que es 936°C. Por le general, se incluye un molde o canal con este fin, en la base del crisol de reducción. El lingote resultante tiene el aspecto metálico plateado que es característico del germanio. El lingote reduciclo se purifica más todavía mt:!diante la refinación por zonas. En este proceso, la barra reducida se coloca en un "bote" largo y angosto hecho de cuarzo o grafito y se desliza a través del horno en forma de tubo en el que se han creado varias zonas calientes angostas para fundir una parte angosta del lingote. Cuando se usan botes de cuarzo, estas zonas calientes se pueden crear por medio de anillos de grafito calentados por inducción de radiofrecuencia o por co-

1

B. Seraphin, Z. Naturforsch, 9a, 5 (1 954).

Preparación de los materiales semiconductores Bobinas de ,..-inducción de

rf"'-....

00000

\

403

00000

00000

00000

1 ub o externo del horno Figura 11.1.

Zonas fundidas

Diagrama esquemático del proceso de refinación por zonas para purificar materiales semiconductores.

rriente directa; cuando se usan botes de grafito, una parte del mismo bote puede actuar como susceptor cuando pasa por una bobina angosta de radiofrecuencia. En cualquier caso, el efecto es fundir una porción del lingote y pasar la zona fundida continuamente a lo largo de la barra, de un extremo al otro, conforme el lingote se desplaza por la zona caliente. La atmósfera de hidrógeno se usa para evitar la oxidación del germanio a altas temperaturas. En la figura 11.1 se ilustra un diagrama de este proceso. De acuerdo con la ley de distribución de Nernst,Z en el estado de equilibrio térmico, un soluto diluido se distribuye entre dos fases disolventes, de manera que la razón de la concentración del soluto en las dos fases es una constante independiente de las concentraciones del soluto. Si por el momento se considera que las dos fases están en equilibrio teniendo una cantidad de soluto en exceso sobre la cantidad que se puede disolver en equilibrio, y si en ambas fases se forman soluciones ideales, es obvio que la razón constante de las concentraciones debe ser la razón de las solubilidades en equilibrio del soluto en las dos fases disolventes. En el caso del proceso de refinación por zonas, se puede considerar que existe un estado de equilibrio aproximadamente3 entre el germanio sólido y líquido, que se pueden tomar como dos fases disolventes, y las impurezas del sistemas actúan (o al menos eso se espera) como solutos ideales. A continuación, cada soluto se distribuye asimismo entre las fases sólida y líquida en la razón entre su solubilidad en el sólido y su solubilidad en el líquido. Esta razón se cita frecuentemente como el valor de equilibrio K para esa impureza específica. Puesto que la mayoría de los elementos de impureza son mucho más solubles en la fase líquida que en la sólida, los valores de equilibrio K para casi todas las impurezas son mucho menores que la unidad. En estas circunstancias, conforme la zona líquida pasa lentamente por la barra sólida, la mayoría de los átomos de impureza en el fundido se ven rechazados por el sólido en la interfaz, en donde la región fundida se solidifica para formar nuevamente una barra sólida. Cuando una sola zona fundida pasa por un lingote largo, los átomos de impureza tienden a recogerse en el líquido y finalmente se precipitan sólo en el mismo extremo del lingote cuando la última parte de la zona fundida se solidifica finalmente. Este proceso de segregación se puede acentuar más todavía repitiendo el proceso y terminando por pasar muchas zonas fundidas por el lingote. En el límite 2 Véase, por ejemplo, G. N. Lewis y M. R:mdall, Thermodynamics, Nueva York: McGrawHill, 1923, página 234. 3 Por supuesto, estrictamente hablando, el equilibrio se mantiene sólo en un sistema a temperatura constante, en el que la interfaz sólido-líquido sería la estacionaria. La descripción anterior no es válida cuando las velocidades de interfaz y los gradientes de temperatura se hacen demasiado grandes.

404

Tecnología de materiales y medición de propiedades volumétricas Concentración

Concentración

¡K-

~=K

C

Cs

Czor------

C¡o

t-----~Cs

------::"!----

-4----------~------------.x

líquido

Sólido

Interfaz (o) Velocidad baja de interfaz Figura 11.2.

-K*

t-------lCs

-4--------~---------------.x

Sólido

Cz

líquido

( b) Velocidad alta de interfaz

Concentración de impurezas en las fases sólida y líquida cerca de una interfaz SÓlido-lÍquida dentro de un aparato de refinación por zonas, (a) a una velocidad baja de interfaz y (b) a una velocidad más alta de interfaz.

de un número infinito de pasos de zona, se logra un perfil restrictivo de concentración y la purificación más allá de esta etapa no se puede lograr de modo directo. Sin embargo, si se desea una segregación de impurezas subsecuente, el lingote se puede sacar del horno, se le quita la porción extrema (que ahora contiene casi todas las impurezas de la muestra) y la sección restante vuelve a someterse a otra refinación por zonas. En cualquier caso, al concluir con el proceso de refinación por zonas, la sección extrema del lingote debe eliminarse. Mientras que para velocidades de interfaz muy lentas la razón de la concentración de impure7as en el sólido a la del líquido es la razón de las solubilidades en equilibrio, para mayores velocidades de interfaz, los átomos de impureza que rechaza el sólido en enfriamiento se concentran cerca de la interfaz más rápidamente de lo que se pueden eliminar por difusión hacia el interior de la zona fundida, como se ilustra en la figura 11.2. La concentración real de impurezas c1 cerca de la interfaz. por tanto es mayor que el valor de equilibrio c10 • El resultado es que se incorporan más átomos de impureza al sólido que en el caso de la velocidad baja, en donde se puede mantener una concentración constante a lo largo de la zona líquida por medio de la difusión. El efecto es el mismo que si el valor de equilibrio K se substituyera con un valor efectivo K*, en donde e, K*= K·--.

(11.1-1)

ero

Puesto que la razón c1/c10 se verá afectada por la velocidad de interfaz, y el coeficiente de difusión de los átomos de impureza en el líquido, K* debe depender también de estos factores. No obstante, es evidente que si K< 1, entonces K* debe ser mayor que K. Por lo común, se considera ventajoso trabajar en condiciones tales que K* sea apreciablemeHte diferente de K, y en estas circunstancias casi siempre es necesario determinar K* por experimentación. Se puede demostrar fácilmente 4 que la distribución de impurezas en un lingote inicialmente uniforme después de pasar por una zona de longitud 1, es (11.1-2)

4

W. G. Pfann, J. Metals, 4, 747 (1952).

Preparación de los materiales semiconductores

405

en donde eso es la densidad inicial de impurezas y x la distancia a lo largo de la barra. También se puede demostrar que la distribución limitante a la que se aproxima después de un gran número de pasadas es (11.1-3) en donde, A

= _c.;;,0=-B_L_ e8 I.

-

(11.1-4)

1

y

K*=_!!!__ eBL - 1

(11.1-5)

En este caso, L es la longitud total del lingote. Para mayores datos sobre el proceso de refinación por zonas, el lector debe consultar el artículo de Pfann4 0 una monografía reciente de Hannai. s Es evidente que el proceso de la retinacion por zonas se puede aplicar no sólo al germanio, sino también a una gran variedad de otros materiales. En la tabla 11.1 se da una lista de los valores de equilibrio K para unpurezas que se encuentran comúnmente en el germanio y el silicio. Debe observarse que el boro es la única impureza común cuyo valor de equilibrio K en el germanio es mayor que la unidad, es decir, que el líquido la rechaza hacia el sólido. Esta peculiaridad da como resultado la segregación del boro en el extremo de la cabeza del lingote más que en su cola. La preparación de silicio altamente puro principia casi siempre con la reducción del tetracloruro de silicio (SiCl4 ) o el triclorosilano (SiHCh) por medio del hidrógeno a aproximadamente 11 00°C. La reacción se desarrolla de acuerdo con la ecuación SiHC1 3

+ H 2 -+ St + 3HCI.

TABLA 11.1 Coeficiente de segregación de Ge y Si6 •7

Impureza

K(Ge)

K(Si)

p

0.12 0.04 0.003 20. 0.1 0.1 0.001

0.04 0.07 0.002 0.68 0.0016 0.004 0.0003

As

Sb 8 Al

Ga In

s N. B. Hannay, Proceedinxs of the Jnternational School o( Physics, "Enrü:o Fermi". Curso 22 {Semiconductores). Nueva York, Academic Press, 1963. págs. 341-435. 6 R. N. Hall, J. Chem. Phys., 51, 836 {1953). 7 J. A. Burton, Physica, 20, 845 {1954).

406

Tecnología de materiales y medición de propiedades volumétricas

Silicio sólido Zona fundida

Figura 11.3.

generador de rf

Representación esquemática del proceso de zona flotante para la purificación d.:-: silicio.

Todos los reactivos se encuentran en la fase gaseosa a la temperatura a la que el proceso se lleva a cabo, con la excepción del silicio, que se precipita en un substrato apropiado. Este substrato puede ser una muestra de un cristal de silicio de alta pureza, en cuyo caso, la estructura reticular fundamental del substrato se continúa en la capa precipitada y, entonces, el proce3o de crecimiento se denommJ. epitaxial. Otra posibilidad es que el substrato sea una varilla delgada de silicio policristalino que produce un lingote cilíndrico apropiado para la refinación por zonas.. La refinación por zonas del silicio es similar en principio, al proceso usadc para el germanio, excepto por la complicación de que el silicio fundido se humedece, reacciona y se contamina prácticamente con cualquier substancia conocida que pueda utilizarse como crisol. Por tanto, es necesario emplear una técnica que nü requiera un crisol y la más común es el proceso denominado zona flotante. En este proceso, una varilla cilíndrica de silicio se sujeta verticalmente por ambos extremos ~ se calienta mediante una bobina de inducción de radiofrecuencia acoplada directamente al mismo silicio. Se puede fundir una región angosta del lingote y la tensiór: superficial del silicio fundido basta para evitar que la zona fundida se derrumbe y se pierda. A continuación, la zona puede pasarse a lo largo del lingote para segregar impurezas hacia un extr~mo, y el proceso se puede repetir cuantas veces sea necesario para alcanzar el grado de pureza requerido. En la figura 11.3 se ilustra este proceso. Se puede reducir el contenido de impurezas eléctricamente activas tanto er: el germanio como en el silicio hasta una parte en 10 11 Esto es suficiente pan producir germanio que es intrínseco a la temperatura ambiente; pero no lo suficientemente bueno para obtener silicio intrínseco (sería necesario otro factor de 10-100 para lograr esto). El silicio y el germanio con refinación por zonas tiene~ la suficiente pureza para servir como material inicial para una gran variedad de dispositivos semiconductores. La preparación de especímenes de alta pureza de los compuestos intermetálicos lli-V se logra casi siempre fundiendo cantidades estequiométricas de los constituyentes elementales sumamente purificados, en tubos de cuarzo sellados, para prevenir la pérdida de los volátiles por evaporación. Los lingotes obtenidos se pueden purificar a menudo de un modo notable mediante la refinación por zonas; pero también en este caso, la muestra debe confinarse a un tubo sellado. En general, los esfuerzos para purificar los compuestos Ill-V por el procedimiento de refinación por zonas u otras técnicas, no han tenido el éxito logrado con materiales del grupo IV.

Crecimiento de muestras monocristalinas 11.2

407

CRECIMIENTO DE MUESTRAS MONOCRISTALINAS

En general, el material producido mediante el proceso de refinación por zonas es policristalino, a pesar de que es muy puro. Lo que normalmente se desea para las investigaciones experimentales o los fines tecnológicos, son muestras semiconductoras de un monocristal que puedan "impuríficarse" intencionalmente con algún elemento de impureza dado, con el fin de producir un material con un tipo de conductividad y una resistividad eléctrica específicas. Existen varías formas de hacer crecer monocristales y cada una posee ciertas ventajas para aplicaciones particulares. Los monocrístales de germanio se hacen crecer por un procedimiento en el que uno de los extremos de un lingote refinado por zonas se pone en contacto con una semilla monocristalína, dentro de un bote apropiado. A continuación se forma una zona fundida entre el cristal semilla y el lingote policrístalino, y se pasa lentamente hacía abajo del lingote, de tal manera que el recrecimiento se inicia en la semilla y continúa su estructura cristalina a lo largo del lingote. Sí se escoge la orientación adecuada de la semilla monocristalína, se puede obtener cualquier orientación cristalina deseada dentro del lingote final,' e incorporando pequeñas cantidades de elementos de impureza a la zona fundida, pueden elaborarse cristales tipo p o n con cualquier contenido de impureza deseado. Se debe permitir un margen apropiado para la segregación de impurezas en la interfaz de crecimiento cuando se calcula la cantidad de impurezas requerida. Puesto que las cantidades necesarias de impurezas que se deben agregar son casi siempre microscópicas, se acostumbra producir una aleación de impurificación de germanio puro al que se ha agregado quizá 0.1 ó 0.01 por ciento de la impureza deseada para introducir esta aleación de impurezas al fundido, en lugar de intentar impurificado de un modo directo. Este proceso es capaz de producir cristales grandes de germanio con una perfección estructural muy elevada y se puede usar también con ciertos compuestos intermetálicos, sobre todo el lnSb; pero no se puede emplear para producir monocristales de silicio, ya que

Salida del cristal -1

Horno de cuarzo Soporte --r-E----1 Semilla Atmósfera inerte o vacío --"""""~

Figura 11.4.

Cristal

Representación esquemática del proceso de Czochralski para h·¡cer crecer monocristales a partir de una fase fundida.

408

Tecnología de materiales y medición de propiedades volumétricas

éste se humedece o reacciona con todos los materiales que pueden utilizarse para fabricar el bote. Sin embargo, se pueden obtener monocristales de silicio de alta calidad utilizando una modificación adecuada del proceso de zona flotante. Otro método que se usa con mucha frecuencia para el crecimiento de monocristales, es la llamada técnica de Czochralski, en el que una semilla monocristalina con la orientación deseada se sumerge en un fundido preparado a partir de un material refinado por zonas y con una impurificación apropiada. El suministro de calor al fundido se reduce y el cristal semilla se extrae lentamente haciéndolo girar al mismo tiempo, como se indica en la figura 11.4. El diámetro del cristal óbtenido puede controlarse regulando la velocidad de extracción y el suministro de potencia al fundido. Un crisol de grafito puede ser satisfactorio para hacer crecer cristales de germanio; pero se requiere un recubrimiento de cuarzo para el silicio. Aunque el silicio fundido se humedece y reacciona con el cuarzo, el recubrimiento es atacado con mucha lentitud y el crecimiento del cristal no se perturba gravemente. Parte del oxígeno del recubrimiento de cuarzo se puede introducir a los cristales de silicio obtenidos por esta técnica; pero no es una impureza eléctricamente activa y no afecta seriamente la calidad del cristal para la mayoría de los fines experimentales o técnicos. La técnica de Czochralski también se puede usar para hacer crecer monocristales de los compuestos intermetálicos 111-V; pero para estas substancias se requiere casi siempre un sistema cerrado para minimizar las pérdidas de los compuestos volátiles. La extracción del cristal y la rotación con frecuencia se logran por medio del sistema sobre armaduras ferromagnéticas del interior. La posibilidad de hacer crecer epitaxialrnente regiones monocristalinas de silicio ya se mencionó en conexión con la preparación de dicho elemento mediante la reducción de fase de vapor de los cloruros. Este proceso es valioso, sobre todo para hacer crecer regiones planas paralelas de tipos opuestos de conductividad o condensidades de impureza abruptamente variables debido a que estas impurezas se pueden incorporar (por ejemplo, como, PC1 3 o BC13 gaseosos) en la corriente de gas de entrada. También se han desarrrollado procesos para adaptar esta técnica al uso del germanio. Además, se ha usado el crecimiento dendrítico del cristal para producir cristales apropiados para utilizarlos en la tecnología de dispositivos semiconductores. El crecimiento dendrítico se produce cuando un cristal semilla se inserta en un fundidc superenfriado. En estas condiciones se inicia un crecimiento rápido semiforme CU) a velocidad se determina de la razón a la que se puede alejar el calor latente de fusión en la interfaz de solidificación. Si el cristal en crecimiento se estira hacia arrriba con gran rapidez sac:\ndolo del fundido, se puede formar una tira dendrítica de semiconductor. Las v'elocidades de crecimiento del orden de 5cm/seg son típicas (er. comparación con 1o- 3 cm/seg del proceso de Czochralski en el que el fundido nc está superenfriado). La anchura y el espesor del cristal dendrítico se pueden controlar dentro de ciertos límites, variando el superenfriamiento del fundido y la velocidad con que se extrae la tira del fundido. También es muy posible, en el caso de: germanio, producir tiras dendríticas de 1 a 5 mm de ancho y de 0.1 a 0.5 mm de grueso. La longitud está limitada sólo por los arreglos que se puedan hacer pan extraer la dendrita. Las superficies de los cristales dendríticos son ópticamente planas y, si se toman ciertas precauciones en su crecimiento, pueden ser fundamentalmente perfectos desde el punto de vista estructural. La ventaja más evidente del procese dendrítico es que produce cristales que se pueden emplear directamente como material inicial para dispositivos semiconductores, sin necesidad de recurrir a operacione1 de corte, pulido, grabado o ataque con ácidos que, de otra manera, son necesariu. El espesor de las tiras dendríticamente crecidas se puede controlar de tal modo qut sea muy uniforme, lo cual tiene gran importancia en muchos procesos de fabricación de dispositivos. Se pueden producír con facilidad cristales dendríticos muy buenos de

Medición de la resistividad volumétrica

409

germanio, silicio e InSb, y también se ha logrado el crecimiento de dendritas de otros compuestos intermetálicos III-V; pero con mayor dificultad y con resultados algo deficientes.

11.3

MEDICION DE LA RESISTMDAD VOLUMETRICA

La medición de la resistividad es la más fundamental de las mediciones de rutina que se hacen en los cristales semiconductores. Básicamente, cualquier medición se hace pasando por la muestra una cantidad de corriente conocida con precisión, y midiendo la caída de voltaje entre dos puntos separados por una distancia conocida. Sin embargo, existen algunas técnicas específicas que tienen la suficiente importancia que justifique un estudio más amplio. Una forma muy exacta de medir la resistividad de un espécimen de semiconductor bastante homogéneo es obtener un potencial transversal de la muestra, haciendo una serie de mediciones potenciométricas de la caída de voltaje entre un contacto fijo y una punta de prueba móvil, conforme este último se desplaza a lo largo de la muestra en pequeños incrementos, casi siempre de 0.5 mm ó 1.0 mm. En la fJgUra 11.5 se muestra un diagrama de esta medición. Si la distancia entre las puntas de prueba se incrementa de x a x + Ax, la resistencia t:.R del elemento pequeño de la muestra que queda entre .X y x + !:u, se suma a la resistencia R de la porción comprendida entre O y x. Entonces, si la corriente que fluye por la muestra es 10 y si se observa un cambio AV en el potencial entre la punta fija y la móvil que acompaña al cambio en el espaciamiento de la punta /:u, por definición de la resistividad, (11.3-1) en donde A es el área transversal (constante) de la muestra. Al resolver para p, es evidente que AL\ V

p=--

(11.3-2)

lol\x

representa la resistividad del material que queda entre x y x + Ax. Si se hace una serie completa de mediciones que incluyen incrementos constantes en el espaciamien-

Al potenciómetro (- l

,...L_

r-.-.,.-,¡vuw11l\ __L_L:.::.:..::::__:=::::.:_:_:.:..:::.::::::~=L!-c.....I4Mt.IJJI

Base Figura 11.5.

Micrómetro para proporcionar el movimiento calibrado de la muestra

Diagrama del aparato para determinar la resistividad volumétrica por el método del potencial transversal.

410

Tecnología de materiales y medición de propiedades volumétricas

to de la punta, se puede llegar a una determinación experimental de la resistividad en función de la distancia a lo largo de la muestra. Esta gráfica a menudo se denomina perfil de resistividad de la muestra. Debe hacerse notar que, puesto que se usa un potenciómetro para medir el potencial entre la punta fija y la móvil, no fluye ninguna corriente entre estos electrodos. Otra forma muy sencilla, pero menos exacta de medir la resistividad, que con frecuencia se puede emplear para controlar las especificaciones del material en procesos de elaboración de dispositivos, es mediante la técnica de las cuatro puntas. En este método, se tienen cuatro puntas de prueba equidistantes que se sitúan sobre la muestra, como se ilustra en la figura 11.6. El par de puntas que queda al exterior se usa para hacer pasar por la muestra una corriente uniforme y el par del interior sirve como probadores de potencial entre los cuales se puede medir potenciométricamente una caída de voltaje. Si se usan los métodos normales de la electrostática y la teoría de la corriente uniforme, se puede encontrar la distribución de potencial resultante y, a partir de esta solución, se puede demostrar que la diferencia de potencial entre las puntas internas debe estar dada por 1 V=2nua

(11.3-3)

en donde 1 es la corriente uniforme que fluye por las puntas probadoras externas y a el espaciamiento entre las puntas adyacentes. Por tanto, la resistividad de la muestra es 1 2naV p=-=--. (1 1

(11.3-4)

Los detalles de la derivación de (11.3-3) quedan asignados como tarea para el lector. Al obtener esta ecuación se supone una muestra semiinfinita y, por tanto. estrictamente hablando, (11.3-3) no es válida para muestras de extensión finita. Sin embargo, si todas las dimensiones de la muestra son grandes en comparación con el espaciamiento de las puntas, a, el error que representa el uso de (11.3-3) o (11.3-41 será muy pequeño. En estos dos métodos mencionados, las condiciones del experimento deben ser tales que se eviten por completo los efectos originados por la inyección de portadores minoritarios en los contactos de la corriente. Esto se logra con mayor facilidad puliendo o usando cualquier otro abrasivo en las superficies de la muestra para que los portadores inyectados en exceso se recombinen rápidamente

Muestra Figura 11.6.

Diagrama esquemático del aparato de cuatro puntas para medir la resistividad.

Medición del contenido de impurezas

411

cerca de los contactos de la corriente y manteniendo la corriente uniforme lo suficientemente baja para .:vitar cualquier modulación significativa de la conductividad mediante los portadores inyectados. Al hacer las mediciones de resistividad a temperaturas bajas es necesario confinar la muestra dentro de un crióstato al vacío 1 para evitar la condensación de la humedad atmosférica ambiental en sus superficies. En estas circunstancias, la resistividad se mide casi siempre de un modo potenciométrico, determinando la caída de voltaje entre dos contactos fijos a una distancia conocida de separación cuanrlo se pasa una corriente uniforme a lo largo de la muestra. A continuación la resistividad procede de (11.3-2) siendo .!lV la caída de voltaje medida y .!lx la distancia entre los contactos. Todos los métodos analizados aquí se aplican principalmente a muestras de suficiente homogeneidad; para especímenes en los que las fluctuaciones de resistividad son grandes en distancias pequeñas, se requiere usar técnicas especiales.

11.4

MEDICION DEL CONTENIDO DE IMPUREZAS Y LA MOVILIDAD MEDIANTE EL EFECTO DE HALL

La teoría del efecto de Hall se estudió en los capítulos 7 y 9, y aquí sólo se verá un estudio breve de las técnicas experimentales. En los extremos de la muestra se establecen contactos de corriente grandes, en tanto que se aplican a los lados pequeñas puntas de prueba o contactos soldados hacia la mitad de la trayectoria de la corriente, para la medición de potencial. Con frecuencia las técnicas de soldadura ultrasónica son muy útiles para establecer estos contactos, así como los que se utilizan para otros fines experimentales. El voltaje de Hall se debe medir potenciométricament~> para satisfacer la condición de que la componente y de la corriente sea cero. Por lo general, las superficies de la muestra se pulen y se usan valores mínimos de corriente de muestra casi siempre, para evitar, lo más posible, la inyección de un exceso de portadores a la misma. Si los contactos de potencial no están perfectamente alineados para que coincidan con los extremos opuestos de la misma línea equipotencial en ausencia del campo magnético estático, además del voltaje de Hall se deberá medir una caída óhmica de voltaje proporcional a la corriente uniforme de la muestra. Esta situación se ilustra en la figura 11.7. El efecto de esta caída óhmica espuria se puede eliminar haciendo cuatro mediciones por separado; primero con el campo magnético y la comente uniforme en dirección positiva, luego con el campo magnético positivo y la Terminal de voltaje 1

---1 1

Error de alineación

Io-

Figura 11.7.

Geometría de las muestras usadas para las mediciones del efecto de Hall, mostrando el origen de las caídas óhmicas de voltaje debidas a una alineación deficiente de los con tactos.

412

Tecnología de materiales y medición de propiedades volumétricas

corriente unifonne inversa, a continuación con el campo magnético y la corriente inversos y, por último invirtiendo el campo y con la corriente positiva. Por tanto, el voltaje de Hall obtenido es (11.4-1) en donde las cantidades entre paréntesis describen la condición de la corriente y el campo pertenecientes a la medición del potencial. Es evidente que la caída óhmica se elimina mediante este procedimiento, ya que el voltaje de Hall cambia de signo tanto con la corriente como con el campo invertidos, en tanto que la caída óhmica cambia de signos sólo cuando la corriente se invierte. Puesto que el análisis de las mediciones de Hall es muy difícil para muestras intrínsecas o casi intrínsecas, cuando se trata de muestras que no son extrínsecas a la temperatura ambiente a menudo se prefiere efectuar las mediciones a temperaturas bajas a las que los especímenes son definitivamente extrínsecos. Esto se aplica sobre todo cuando el objetivo primordial es evaluar la densidad neta de átomos de impureza de las muestras. En estas circunstancias se requiere usar un crióstato al vacío. También se necesita utilizar valores de campo magnético estático suficientemente bajos para que w 0 T~ 1, en donde w 0 es la frecuencia de ciclotrón eE0 /m*c, para que sea válido el análisis de la sección 9.8. La densidad de portadores de la muestra se puede calcular a partir del voltaje de Hall de acuerdo con los métodos que ya se desarrollaron y describieron en las secciones 7.6 y 9.8. La movilidad de Hall puede obtenerse combinando los resultados de Hall y la resistividad; este procedimiento se delineó ya en la sección 9.8.

11.5

MEDICION DEL TIEMPO DE VIDA DE LOS PORTADORES EXCEDENTES

La medición del tiempo de vida de los portadores en exceso se logra casi siempre observando el decaimiento de la fotoconductividad transitoria. La teoría de esta medición se vio detalladamente en la sección 10.7 y no es necesario que se agregue nada aquí, excepto una breve descripción del aparato. Se puede utilizar un tubo de arco de gas de xenón a alta presión (como por ejemplo, el Edgerton, Genneshausen y Grier XP-12) para excitar la fotoconductividad de la muestra. Este tubo produce una iluminación muy intensa y repentina que dura aproximadamente 10- 6 seg. El bulbo o tubo puede usarse en combinación con un sistema óptico para concentrar en la muestra la mayor cantidad de luz posible. Un arreglo muy aceptable es montar el tubo de "flash" en uno de los focos de un

Reflector 4000V~~~~~---,

Fuente de alimentación de alto voltaje

Batería de barrido 1111~~+---o

Figura 11.8.

~

Osciloscopio

t----..._--11---o

Representación esquemática para la determinación de los tiempos de vida de los portadores en exceso a través de las mediciones de fotoconductividad transitoria.

Dislocaciones y otras imperfecciones

413

reflector elipsoidal y la muestra en el otro. El bulbo de "flash" es similar a los que se utilizan como fuentes lumínicas fotográficas. Se puede operar como un oscilador de relajación de funcionamiento libre en un circuito como el que aparece en la figura 11.8, con el fm de obtener "flashes" repetitivos. El decaimiento de la fotoconductividad se observa en un osciloscopio de banda ancha y los tiempos de vida se obtienen de las curvas de decaimiento observadas aplicando los métodos que se vieron en la sección 1O. 7 Este método se re!ftringe a tiempos de vida superiores a w- 6 segundos, ya que la iluminación del bulbo de "flash" no se corta abruptamente, sino que se pierde con cierta constante de tiempo de este orden de magnitud. Se han desarrollado fuentes especiales de chispa que se pueden emplear para resolver tiempos de vida algo más cortos.

11.6

DISWCACIONES Y OTRAS IMPERFECCIONES

Las dislocaciones son defectos reticulares en cristales que se pueden comprender en función de un deslizamiento interno parcial. Existen dos tipos básicos de estructuras con dislocación, las de tipo de borde y las de tipo de tornillo. En la figura 11.9 se muestra el tipo de dislocación de borde. Se puede considerar que este tipo de dislocación es el resultado de un deslizamiento interno parcial en el plano ABCD a lo largo de la dirección BC. En la ilustración, la magnitud del deslizamiento es una distancia interatómica. Se puede pensar que el cristal resultante contiene un medio plano extra de átomos (ABEF en el diagrama) y está claramente en un estado de esfuerzo mecánico en la región del borde de dislocación AB tal, que el material está en tensión por encima del borde de dislocación y en compresión por debajo de éste. La dislocación tipo tornillo se ilustra esquemáticamente en la figura 11.1 O. En esta estructura con dislocación, el deslizamiento se ha desarrrollado paralelamente a la línea de dislocación, que es normal a la superficie superior del cristal, más que

E

e - Vector de deslizamiento

F

,' ,

Figura 11.9.

..1/

A

Diagrama esquemático de un cristal que contiene una di~locación tipo borde. La dislocación se puede considerar como producida por un deslizamiento que representa un espaciamiento de red en la dirección BC. Puede pensarse que el cristal contiene el "plano adicional" de átomos, ABEF.

414

Tecnología de materiales y medición de propiedades volumétricas

Vector de deslizamiento Figura 11.10.

Representación esquemática de una dislocación tipo tornillo.

perpendicular a la línea de dislocación, como sucede en el caso de la dislocaciór: tipo borde. En realidad, las dislocaciones de borde y tomillo pueden considerarse como diferentes aspectos del mismo fenómeno de deslizamiento interno, como se indica en la figura 11.11, que es una vista del cristal que aparece en la figura 11.9 con una región de deslizamiento interno de distinta forma. En este caso, la mismé línea de dislocación (representada siempre por el símbolo 1) es normal al vector de deslizamiento en la cara frontal del cristal, como en una dislocación de borde, ~ paralela al vector de deslizamiento en un lado, como en la dislocación de tornillo. Quizá sea más exacto decir que la dislocación posee una orientación de borde en e: frente y una orientación de tornillo lateral, aunque no se usará aquí rigurosamente esta terminología. Las dislocaciones se forman en las etapas iniciales del crecimiento del cristal ~ son responsables de muchas propiedades que se observan en los cristales. En realidad.

fTornillo

/Vector de deslizamiento

¡..___,,__.

Figura 11.11.

Cristal que contiene una región de deslizamiento que origina una dislocación que tiene, en parte, una orientación de tornillo y, en otra, una orientación de tipo borde.

Dislocaciones y otras imperfecciones

415

la mayoría de las características observadas del crecimiento del cristal a partir de un fundente líquido de una solución supersaturada o de una fase de vapor, están gobernadas por las dislocaciones en los cristales de crecimiento más que por cualquier otra propiedad de la red cristalina perfecta propiamente dicha. La razón de esto es que los átomos de las fases líquida o de vapor están enlazados a una cara creciente del cristal con mayor fuerza en un "escalón" en el que termina una capa incompleta de átomos, que en un sitio aislado en la cara del crecimiento. Esto es cierto porque en el escalón, un átomo que entra puede unirse a dos átomos de la red cristalina más bien que a uno sólo. En la figura 11.10 se ilustra esta situación. Por tanto, el crecimiento procederá con mucha mayor rapidez (o con la misma rapidez a un nivel mucho más bajo de saturación o subenfriamiento en la fase líquida o sólida) en una cara de escalón que en una superficie plana completa y estructuralmente perfecta. La formación de un escalón en un cristal estructuralmente perfecto mediante la coalescencia de varios átomos aishdo~ que se depositan de un modo aleatorio de la fase líquida o de vapor, es no obstante un suceso de muy escasa probabilidad, ya que tales átomos no están fuertemente unidos a la cara del cristal y, por lo general, no se unen a él el tiempo suficiente para enlazarse y formar un escalón de crecimiento; por lo contrario, casi siempre se sueltan por agitación térmica antes de que esto pueda ocurrir. Cuando se forma un escalón de esta manera, se extenderá con gran rapidez a través de la cara del cristal mediante la adición de átomos en los bordes, en donde se unen con gran fuerza hasta que se haya agregado una nueva capa atómica. Entonces, el crecimiento posterior procede sólo con gran dificultad, ya que ahora se debe formar un nuevo escalón sobre la capa añadida. Sin embargo, la situación es totalmente diferente si el cristal contiene una dislocación de tornillo, como se ilustra en la figura 11.1 O. La dislocación de tornillo proporciona un escalón autoconstruido que no se puede eliminar nunca de la cara de crecimiento mediante la adición subsecuente de átomos. Cuando los átomos se agregan a una velocidad constante al escalón asociado con una dislocación tipo tornillo, como la que s~ ilustra en la figura, todas las partes del escalón obtienen la misma veloddad de crecimiento lineal constante. Esto produce una velocidad angular de crecimiento respecto del centro, que es mayor cerca de la dislocación que lejos de ésta, y el escalón tiende a tomar una forma espiral arrollándose alrededor de la dislocación central. Estas configuraciones espirales escalonadas se observan con frecuencia en cristales en crecimiento y proporcionan una evidencia directa de que éste constituye un mecanismo importante de crecimiento. 8 Sólo estos pequeños núcleos cristalinos formadQs en un fundido ligeramente subenfriado o en una solución supersaturada, que contienen dislocaciones, son capaces de crecer a un tamaño macroscópico antes de separarse por agitación térmica. Los procedimientos de crecimiento que se pueden observar en muestras cristalinas ordinarias son procesos que se asocian con la presencia de dislocaciones de tornillo. Cuando se aplican esfuerzos a cristales que contienen dislocaciones, se puede mover la dislocación dentro de ellos. Por ejemplo, si se aplica un esfuerzo cortante proveniente de una fuerza dirigida hacia la izquierda y aplicada a la parte superior de la muestra, y una fuerza a la derecha en la parte inferior, en el cristal de la figura 11.9, la línea de dislocación AB puede desplazarse hacia la izquierda a través del cristal. Aunque un estudio completo de la mecánica de las dislocaciones está fuera del alcance de este estudio, casi todas las propiedades mecánicas de cristales macroscópicos, incluyendo los módulos elásticos, la deformación plástica y por deslizamiento, el endurecimiento con aleaciones y tratamientos térmicos, las propiedades 8 Por supuesto, para ser observables incluso al microscopio electrónico, el vector de deslizamiento de la dislocación de tornillo asociada con estas "espirales de crecimiento" deben extenderse muchas veces sobre la dimensión de la célula unitaria.

416

Tecnología de materiales y medición de propiedades volumétricas

Figura 11.12.

Resolución de un desajuste atómico de una frontera de grano con ángulo pequeño, mediante la formación de una hilera de dislocaciones tipo borde.

de templado y endurecimiento por trabajo, se pueden explicar en función del movimiento de las dislocaciones y la interacción de éstas mismas, así como con los átomos de impureza.9 • 10 La formación de fronteras de grano y las regiones de material estructuralmente imperfecto, asociadas con las fronteras de grano, se pueden estudiar también de acuerdo con las dislocaciones. En particular, el desajuste entre los planos cristalinos que se producen en una frontera de grano de ángulo pequeño se puede resolver a través de la formación de una hilera de dislocaciones tipo borde en dicha frontera, 11 como se ilustra en la figura 11.12. Este tipo de frontera de cristal se denomina a veces frontera lineal de Burgers. La presencia de dislocaciones tipo borde en cristales semiconductores se detecta fácilmente con ataques químicos en la superficie cristalina utilizando ciertos reactivos. Puesto que la red cristalina alrededor de la dislocación ya se encuentra en un estado de deformación, se requiere menos energía para romper la red en ese punto que en cualquier otra parte. Como resultado de esto, el ácido ataca la superficie cristalina con mayor rapidez cerca de las dislocaciones formando pozos claramente visibles al microscopio que marcan la intersección de las dislocaciones de borde con la superficie del cristal. En la figura J 1.13 se muestra una fotografía con pozos atacados con ácido en las dislocaciones asociadas con una frontera de grano de ángulo pequeño en el germanio. Estas fotografías proporcionan una verificación experimental sorprendente de la representación de una frontera de ángulo pequeño que se muestra en la figura 11.12, ya que el ángulo de desajuste entre las dos secciones del cristal se puede calcular a partir del espaciamiento entre los pozos y determinarse experimentalmente a través de mediciones de difracción de rayos X. Por tanto, 9 W. T Read, Dislocations in Crystals, Nueva York: McGraw-Hill, 1953. 10 A. H. Cottrell, Dislocations and Plastic Flow in Crystals. Nueva York: 11 J. M. Burgers. Proc. Phys. Soc. (Londres) 52, 23 (1940).

Oxford, 1953.

Dislocaciones y otras imperfecciones

Figura 11.13.

417

Dislocaciones tipo borde en una frontera de grano con un ángulo pequeño en un cristal de germanio, tal como las descubren un ataque químico. La amplificación es aproximadamente 600X ..[Fotografía del autor.]

los dos valores obtenidos concuerdan invariablemente de un modo muy aceptable. 12 En la figura 11.13 se pueden observar también algunos pozos atacados con ácidos que se originaron por la presencia de dislocaciones aleatorias. En cristales de silicio se pueden observar directamente las líneas de dislocación mediante la difusión de cobre en la muestra, y luego observando microscópicamente el interior del cristal utilizando luz infrarroja de una longitud de onda que sobrepase apenas el borde de absorción. 13 Se emplea un bulbo convertido de imagen para hacer que el ojo pueda captar la imagen infrarroja. El cobre, que es opaco a la radiación infrarroja, se precipita a lo largo de las líneas de dislocación formando trazos oscuros que mar· can el curso de dichas líneas. La presencia de dislocaciones en cristales semiconductores también da origen a ciertos efectos eléctricos. Por ejemplo, en el caso del germanio, parece que las dislocaciones tipo borde introducen niveles receptores que se localizan a una gran profundidad, aproximadamente 0.2 eV de energía por debajo del borde de la banda de conducción. 14 • 15 Además algunas investigaciones independientes han demostrado que las dislocaciones tipo borde actúan como centros de recombinación en el germanio, y de hecho, el tiempo de vida de los portadores en exceso en germanio de alta pureza casi siempre tiene un límite marcado por la dislocación.16, 17 La situa-

12

F. L. Vogel y colaboradores, Phys Rev., 90. 489 (1953).

13 W. C. Dash, J. Appl. Phys., 27, 1193 (1956). 14 G. L. Pearson, W. T. Read y F. J. Morin, Phys. Rev., 93, 666 (1954). 15

W. T. Read, Phil. Mag., 45, 775 (1954).

16 J. P. McKelvey, Phys. Rev., 106, 910 (1957). 17 G. K. Wertheim y G. L. Pearson, Phys. Rev., 107, 694 (1957).

418

Tecnología de materiales y medición de propiedades volumétricas

• • • •• • • • • • • • • • • • • • • • • • • • •

• • • • •



• • • • • • • • • • • • • • • • • • • • • • •





• • •



• •

• • • • • •

( b)

(a)

Figura 11.14.

• •

• •

Defecto (a) de Frenkel y (b) de Schottky en una red cristalina.

c1on en el silicio y otros semiconductores no se ha investigado con la misma minuciosidad debido a las dificultades técnicas; pero se supone que el caso es similar. Otro ejemplo importante de una imperfección estructural es la vacante de red. Existen dos tipos básicos de vacantes de red denominados defectos de Frenkel y defectos de Schottky, como se ilustra en la figura 11.14. En la formación de un defecto de Frenke1, un átomo de la red cristalina se desplaza a una posición intersticial dejando una vacante de red tras él, en tanto que para formarse un defecto de Schottky, uno de los átomos de la región cercana a la superficie se pasa a un sitio de la superficie dejando tras sí una vacante móvil que luego puede difundirse hacia el interior del cristal. Existe una energía de activación asociada con la formación de cualquier defecto de esta índole y, dado que la energía térmica disponible para contrarrestar la barrera de activación es mayor a alta temperatura, la concentración de equilibrio de las vacantes aumenta con ésta. Se cree que los defectos de Schottky predominan en el germanio y en el silicio. Si el cristal se enfría repentinamente desde una temperatura alta, se puede "congelar" en el interior una concentración de vacantes por encima de la concentración de equilibrio a temperatura ~biente. El papel de las vacantes de red en la difusión de átomos de impurezas de substitución. desde la superficie hasta el interior de la red cristalina, tiene gran importancia. La presencia de vacantes de red permite que los átomos de la estructura reticular (al igual que los de impureza) emigren de un sitio de la red dentro del cristal a otro, y o

o

o

o

o

o

o

o

o

o

o

o

o

o

o

o

o

o

o

o

o

o

o

• • o • • • • • • • • • • • • • • • ( b)

• •

• • • • • • • • • • • •(a)• • • o

o

o

o

o

o

o

o

o

o

o

• •



o

o

• • • • • • • • • • • • • • • ( d)

• • • • • • • • • • • • • • (e) o

o

o

o

o

o

o

o

o

o

• •

o

o

o o

o o

o

oooeoo

• •

• • • •



o







• • • • • • (e)

Figura 11.15.

Interdifusión en una interfaz entre dos substancias diferentes, originada por el movimiento de una vacante de red. Etapas sucesivas en el proceso de difusión. de (a) a (e).

Dislocaciones y otras imperfecciones

419

con esto se efectúa el transporte por difusion de átomos de impureza superficiales hacia el interior. Este proceso se ilustra en la figura 11.15. La mayoría de las características importantes de la difusión de impurezas de substitución en cristales semiconductores, incluyendo la magnitud de los coeficientes de difusión y su dependencia en relación a la temperatura, concuerdan con el mecanismo de las vacantes.

EJERCICIOS l. Derive las ecuaciones (11.1-2) a (1 1.1-5) a partir de las consideraciones fundamentales. 2. Se desea hacer crecer un monocristal de germanio tipo p con una resistividad de 2 a 5 ohms-cm mediante la técnica de Czochralski. Como material inicial se utilizarán 500 g de germanio intrínseco refinado por zonas. ¿Qué cantidad de aleación de impurificación compuesta de germanio que contiene 0.1 por ciento de galio atómico debe agregarse al fundente para que la resistividad a la temperatura ambiente de la parte del cristal que crece iniciahnente sea 5 ohms-cm? Se puede suponer que el coeficiente de segregación apropiado es el de equilibrio que se da en la tabla 11.1. ¿Cómo variará la resistividad del cristal así obtenida en función de su longitud? 3. Use la teoría electrostática y de corriente uniforme, suponiendo una muestra semünfinita homogénea e isotrópica, para derivar la ecuación (11.3-3) para el aparato de rt>sistividad de cuatro puntas. Demuestre explícitamente que la solución satisface todas las condiciones necesarias de frontera. Nota: Principie tomando en cuenta el campo electrostático creado por una carga positiva puntual y una carga negativa puntual en el espacio libre. 4. Una frontera lineal de Burgers en un cristal cúbico simple crea una línea de pozos atacados con ácido, con un espaciamiento de 2 X 10-4 cm, cuando el cristal se ataca químicamente. Suponiendo que la constante de red del cristal es 4 X 10-8 cm, encuentre el ángulo de desajuste entre las secciones del cristal en los lados opuestos de la frontera lineal. 5. Una punta metálica de prueba establece contacto con un cristal semiconductor semünfinito de una conductividad constante a. Se hace pasar una corriente constante conocida, / 0 , por la punta hacia el semiconductor. Suponiendo que la interfaz entre la punta de prueba y el semiconductor es una semiesfera de radio a que se extiende dentro del semiconductor, en donde el centro queda en el plano de la superficie del semiconductor y que no se inyecta un exceso de portadores a través de la punta, calcule la impedancia (resistencia de dispersión) del contacto.

LECTURAS RECOMENDADAS W. Bardsley, "The Electrical Effects of Dislocations in Semiconductors," en Progress in Semiconductors, Vol. 4, Heywood and Co., Londres (1960), p. 155. A. H. Cottrell, Dislocations and Plastic Flow in Crystals, Oxford University Press, Nueva York (1953). l. G. Cressel y J. A. Powell, "The Production of High Quality Germanium Single Crystals," en Progress in Semiconductors, Vol. 2, Heywood and Co., Londres (1957), p. 137. P. Haasen y A. Seeger, "Plastische Verformung von Halbleitern und ihr Einfluss auf die Elektrische Eigenschaften," en Halbleiterprobleme, Vol. 4, Friedrich Vieweg and Sohn, Braunschweig (1958), p. 68. N. B. Hannay, "Semiconductor Chemistry," en Proceedings of the lnternational School of Physics, "Enrico Fermi" Course 22 (Semiconductors, Academic Press, Inc., Nueva York (1963), p. 341. w. G. Pfann, "Techniques of Zone Melting and Crystal Growing," en Salid State Physics, Advances in Research and Applications, Vol. 4, Academic Press, lnc., Nueva York (1957), p. 423. W. G. Pfann, Zone Melting, John Wiley & Sons, Nueva York (1958). W. T. Read, Dislocations in Crystals, McGraw-Hill Book Co., Inc., Nueva York (1953). W. Schockley, J. Holloman, R. Maurer y F. Seitz (editores), lmperfections in Nearly Perfect Crystals, John Wiley & Sons, Nueva York (1952). R. K. Willardson y H. L. Goering (editores), Compound Semiconductors, Vol. 1, Reinhold Publishing Corporation, Nueva York (1962).

Teoría de las uniones p-n de los semiconductores

12.1

LA UNION p-n

En capítulos anteriores se trató exclusivamente de los semiconductores que se suponían uniformes u homogéneos en cuanto a la densidad de átomos de impureza contenidos en su interior. Ahora se centrará la atención en el estudio de substancias dentro de las cuales la densidad de impureza puede variar de un punto a otro y, en particular, en muestras que contienen una región extrínseca tipo n y una región extrfuseca tipo p separadas por una zona de transición relativamente angosta. Esta región angosta de transición se denomina unión p-n y con ella se asocian propiedades físicas sorprendentes que, aunque tienen interés específico desde un punto de vista puramente fundamental, poseen una importancia primordial, ya que constituyen la base de operación de la mayoría de los dispositivos electrónicos semiconductores. A continuación se estudiará un cristal semiconductor que contiene una unión p-n. La transii:ión entre las regiones tipo p y n puede ser abrupta, en cuyo caso se encuentra unl!. región que contiene una concentración neta más o menos constante de impurezas donadoras junto a otra que posee una concentración neta más o menos constante de receptoras. Por otro lado, la unión puede ser graduada, en cuyo caso, N d y Na son funciones de la distancia a la unión en dirección de la normal, donde Nd decrece gradualmente empezando con un valor grande y Na aumenta en la misma forma a partir de un valor pequeño, conforme se acerca a la unión desde el lado tipo n; las dos cantidades se igualan en la unión y Na sobrepasa a Nd en el extremo de la unión dentro de la región p. Estos dos casos se ilustrat'l en la figura 12.1. En este estudio, el mayor énfasis se dará a las uniones abruptas, ya que son mucho más sencillas de analizar matemáticamente, puesto que ilustran la mayoría de las características importantes relacionadas con el comportamiento de las uniones p-n en general y, ya que, para la mayoría de dispositivos más importantes, la representación aproximada de la unión abrupta es aceptable. No obstante, debe hacerse notar que en muchos casos la uniones p-n de las estructuras de dispositivos semiconductores (sobre todo las que se producen una conductividad tipo n o p en un substrato de conductividad opuesta) son uniones graduadas. Se intentará señalar cualitativamente por lo menos, las diferencias existentes entre las conducta física de las uniones abruptas y graduadas, siempre que se presente la ocasión. 421

422

Teoría de las uniones p-n de los semiconductores

----------~~------------ --x

tipo-n

Figura 12.1.

tip01J

tipo-p

ti po-n

Unión

Unión

(a)

(b)

Concentraciones de átomos de impureza en la cercanía de (a) una unión p-n abrupta y (b) una unión p-n graduaL

Supóngase que de alguna manera se forma instantáneamente una unión abrupta p-n juntando una muestra uniforme tipo p con otra tipo n 1 para formar un solo

cristal. En el instante de formación existe una concentración uniforme nno de electrones libres móviles y Pn 0 de huecos libres móvibles en el lado n, extendiéndose hasta la unión, y en el lado p, una concentración uniforme Ppo de huecos móviles y npo de electrones libres que se extiende también hasta la unión. Estas concentraciones están relacionadas con las densidades netas de donadores y receptores Nd y Na por medio de {9.5-23) y {9.5-24), en tanto que en ambos lados las densidades de electrones y huecos satisfacen la relación (12.1-1)

Puesto que la concentración nn 0 de electrones del lado n es mucho mayor que la concentración de electrones npo del lado p, en el instante de formación existe un gradiente enorme en la concentración de electrones en la unión entre ambas regiones. La misma situación existe con respecto a la concentración de huecos en la misma unión. Los grandes gradientes iniciales de concentración establecen corrientes de difusión que hacen que los electrones de la región n y los huecos de la región p fluyan descendiendo por los gradientes de concentración respectivos hasta la región de conductividad de tipo opuesto y dejando a la región cercana a la unión, vacía de portadores mayoritarios. No obstante, este flujo de difusión inicial no puede continuar indefinidamente, debido a que en las regiones cercanas a la unión hay deficiencia de portadores mayoritarios, las cargas de los iones fijos donadores y receptores cercanos a la unión ya no están balanceadas por las cargas de los portadores libres móviles que estaban allí inicialmente, de modo que se establece un campo eléctrico. La dirección de este campo eléctrico es tal que se opone al flujo de los electrones que salen de la región n y al flujo de los huecos que salen de la región p, y la magnitud de campo se desarrolla hasta el punto en que su efecto contrarresta exactamente la tendencia de los portadores mayoritarios a difundirse. descendiendo por la "pendiente" de concentración hacia la región de conductividad 1 La formación de una unión de esta manera es sólo un experimento imaginario y no puede efectuarse en la práctica. La estructura de la unión p-n debe existir como un monocristal casi perfecto y sólo se puede obtener impurificando debidamente el fundente "contraimpurif¡. cándolo" (o agregándole impurezas de otro tipo), conforme va creciendo el cristal o bien. utilizando alguna difusión especial o proceso de aleación con que se logre prácticamente el mismo resultado.

La unión p-n tipo-p

Unión

tipo-n

1

+e e +e+ e 1 e e e +e +e e+ 1 e ~ + + e 1 Carga + 'é +e e+ e 1-espac!al e+ l negativa

e

+ +

e

e

EB

EB

1

1

EB

1

EB

EBI IEB

Carga __j espacial positiva 1

EB

e

e

+

IEB

1

+ e+e++e e le ee e+ e +¡e e e + + e e ¡e + + e e+ + e e ee + ee 1 e + ¡e ++ee+e e +



1

e

Iones fijos de impurezas donadoras

e Iones fijos de impurezas receptoras Figura 12.2.

EB

EB ee 1 e + + + ¡e e EB EB 1 e e e e ~1 e 1 EB ' EB Cam~o ehfctrico e+e+e; e le EBI e+ e+ + 1 e e+ e + e EB EB 1 + + + e +e 1 e e

+e

+

423

1

-

EB

EB ¡-EB 1

1

EB

JEB-

EB

J

- Electrones libres + Huecos libres

Diagrama que ilustra la formación de las capas de carga espacial y el campo eléctrico interno mediante la difusión de portadores mayoritarios cerca de una unión hacia la región con un tipo de conductividad opuesta.

opuesta. Entones se establece una condición de equilibrio dinámico en la que la región cercana a la unión queda vacía de portadores mayoritarios y en la que forman fuertes capas de carga espacial que contienen campos eléctricos altos cerca de la unión. Esta situación se ilustra en la figura 12.2 y, de acuerdo con ella, es evidente que la configuración de carga espacial es una caplt dipolar eléctrica con iones donadores no compensados en el lado n y iones receptores no compensados en el lado p, proporcionando los componentes de carga positiva y negativa respectivamente. Uno de los resultados más conocidos de la electrostática es que se produce una diferencia de potencial entre los dos límites extremos de una capa dipolar eléctrica, que se relaciona con la intensidad (momento dipolar por unidad de área) de la capa mediante (12.1-2) en donde r/> 1 y r/> 2 son los potenciales de borde y .d es la intensidad de la capa dipolar. Por supuesto, más allá de las regiones de la carga espacial no existe una densidad de carga y, por tanto, el potencial electrostático es constante. De acuerdo con (12.1-2), la energía potencial de un electrón "en reposo" situado en la base de la banda de conducción es 41Te .d menor en un lado de la unión que en el otro. Se puede formular el mismo enunciado para un hueco "en reposo" que esté en la parte superior de la banda de valencia. Sin embargo, puesto que el estado del sistema es de equilibrio térmico, la energía de Fermi e¡ debe ser la misma en todo el sistema. Estas consideraciones permiten describir las bandas de energía abrupta tal como se

424

Teoría de las uniones p-n de los semiconductores

fEnergfa potencial de electrones ;;;__+___

••p _ _ _ _ _ _ _ _

1 1

----------------t-.. •, •rp

1

-

1 1 1

1-

',

...

--

-- -

-----

~ t:n

•,-x

1

+++ ++ +++++++ +++ + + 0._--~------,------+ ++ + + + + +1 + + -e (X) + + + 1 ---------:---+ + : 1 + + + + ••• --r--sc- +sc+-

~-+-1

tip01) (Densidad de receptores Figpra 12.3.

Unión N0

ti po-n (Densidad de donadores

)

Nd)

Diagrama de la energía potencial en el que se muestra la configuración de bandas de energía cerca de la unión p-n en ausencia de un voltaje aplicado.

ilustra en la figura 12.3. Evidentemente, existe un "potencial de contacto interno·· - cp 1 ) = ecp0 desarrollado entre las dos regiones. En esta misma figura se pueden ver claramente las tendencias de oposición de los gradientes de concentración y los campos eléctricos; los electrones
e(cp 2

12.2

EL POTENCIAL DE CONTACTO INTERNO DE EQUILIBRIO

El valor del potencial de contacto interno cf>o se determina fácilmente a partir de los valores de la densidad de electrones (o huecos) en equilibrio a ambos lados de la unión, lejos de las regiones de carga espacial. De acuerdo con (9.3-6), se puede escribir (12.2-1)

para la densidad de electrones en el lado n y, para la densidad del lado p, (12.2-2)

De ~stas ecuaciones se pueden despejar €en y ecp y la diferencia de energía potencial interna ecp 0 , que, como se puede ver claramente en la figura 12.3 no es más que la diferencia entre las dos, por lo cual está dada por

el/> 0

n.o

= ecp - ec• = kT ln-.

npo

(12.2-3)

Esto se puede escribir de un modo diferente utilizando (12.1-1) para expresar npo en función de Ppo, como ,~,

_ kT 1 n.oPpo n 2 ·

'I'O-

e

11¡

(21.2-4)

El potencial de contacto interno de equilibrio

425

Si todos los donadores y receptores de las regiones n y p están ionizados, como lo estarán a todas las temperaturas, excepto las muy bajas, y si las dos regiones p y n son fuertemente extrínsecas, entonces, de acuerdo con (9.5-25) y (9.5-26) nno ~Na y Ppo ~Na, por lo cual, (12.2-24) se convierte en ( 12.2-5)

La aplicabilidad de estas fórmulas está evidentemente limitada a situaciones en que las estadísticas de Boltzmann se pueden utilizar para describir la distribución de equilibrio de los portadores, tanto en la región p, como en la n. A continuación se examinará lo que sucede cuando se aplica un voltaje externo a la muestra que contiene una unión p-n. Es obvio que, puesto que las regiones de carga espacial a ambos lados de la unión tienen una deficiencia de portadores, estas regiones poseen una resistividad mucho mayor que cualquier otra parte del cristal. Esto significa que cuando se aplica una fuente de voltaje externo a la muestra en que se tiene una región p-n, como sucede en la figura 12.4, casi toda la caída de voltaje se producirá en estas regiones. Prácticamente en todas las condiciones, excepto aquellas en las que se aplica un voltaje grande con la "polaridad en directo" que se indica en la figura 12.4(a), las caídas de voltaje en las regiones uniformes n y p que quedan fuera de las capas de cargas espacial cerca de la unión, son despreciables en comparación con la caída que se registra en la región de la unión misma. Si la unión p-n se usa como rectificador, se obtiene una condición de baja impedancia cuando la región n se conecta a la terminal negativa y la región p a la positiva de la fuente externa de voltaje, como se señala en la figura 12.4(a). Esta polaridad se conoce como estado de polarización directa. Se acostumbra considerar que el signo del potencial externamente aplicado en este caso es positivo. En la figura 12.3 se ve claramente, que cuando se aplica el voltaje externo en esta forma, el efecto es reducir la altura de la barrera de potencia. como se muestra en la figura 12.4(a). Si la caída de voltaje en las regiones volumétricas n y p que quedan fuera de la capa de carga espacial es despreciable en comparación con la que se produce en la unión, la altura de la barrera intensa será e(!/Jo - V0 ) en donde V0 es el voltaje externo. Si se invierte la polaridad de la fuente de potencial externo (en cuyo casos su signo se oonside· rará negativo), se observa claramente en la figura 12.3, que la altura de la barrera de po-

~ y~ V0

(Positivo)

e (1(>0 -1{¡)

- -~, ----!----

~ V0

(Negativo)

.

eof>o

-~ ----1---

"'-. Con el potencial '------ aplicado

''

' ... _

L

--"'10.

............_____

'Aplicando potencial

____¡~ ___ )~""-----

Aplica~d1o

f

~

eof>

t-

potenc1a

Sin aplicar potencial (O)

Figura 12.4.

(b)

Diagrama de la energía potencial que presenta el efecto de (a) un voltaje de polarización directa y (b) de polarización inversa en la configuración de bandas de energía en una unión p-n.

426

Teoría de las uniones p-n de los semiconductores

tencial interno se ha incrementado como se ilustra en la figura 12.4(b ). Si la caída entre las regiones n y p que quedan fuera de la unión se desecha en comparación con la caída en las regiones de carga espacial de la unión, también es obvio que la altura de la barrera se puede representar como e(tf>o - ~0 ) en donde Voz es ahora una cantidad negativa. En estas circunstancias, como se verá detalladamente más adelante, la estructura presenta una independencia muy alta y se dice que el voltaje aplicado es una polarizadór: inversa.

12.3

POTENCIALES Y CAMPOS EN LAS CERCANIAS DE UNA UNION p-n

Ahora se verá el modelo general de una unión p-n como la que se ilustra en la figura 12.5. Como se ha representado en esta figura, existe un voltaje aplicado V 0 (negativo en el dibujo) al igual que un potencial interno t/> 0 . En estas circunstancias. se tendrán flujos de corrientes eléctricas y el estado del sistema ya no será de equilibrio térmico. Por esta razón, no se puede definir ya un nivel único de Fenm para todo el cristal. Sin embargo, se supondrá que lejos de la unión prevalecen las condiciones de equilibrio y que las densidades de huecos y electrones en esos puntos se pueden describir mediante las distribuciones de Fermi relacionándolas con los dos niveles de Fermi E¡no y E¡po· Por supuesto, si no se aplica un voltaje, el sistema estará en equilibrio y E¡no y E¡po serán equivalentes; pero como están las cosas, es obvio, de acllerdo con la figura, que deben diferir en eV0 • Cuando se aplica un voltaje a la unión, resulta que, como se demostrará sin lugar a dudas más adelante. la concentración de portadores minoritarios en las regiones n y p contiguas a las capas de carga espacial se ven seriamente perturbadas en sus valores de equilibrio, en tanto que la concentración de portadores mayoritarios se ven muy afectados en lo -e4>(x)


Densidad de donadores

Nd (xl

T

.,P(x) 'fpo

-......._:---------"""T"--t---;-+T---f'"'--

f~p

' ',

-l,

-+-~-+-~-.l-- ---x

..... ,

' ',

v:_o_:-:lla=-----~'cl-~=---t--------'--'-'..::.-:::.

' ' [ .... - ---e. . . • ,. (x)

1

Densidad de receptores N.lxl tipo-p Figura 12.5.

"-+--------- ...

1

¡---se '

x=-x 0 _

+se-¡ un¡ón x=O

tipo-n

Diagrama que ilustra los detalles de los potenciales en las bandas de energía y los niveles casi Fermi de una unión p-n en presencia de un voltaje aplicado.

Potenciales y campos en las cercanías de una unión p-n

427

que respecta a sus concentraciones de equilibrio. La razón se puede entender al estudiar la figura 12.5, en donde se muestra una unión con polarización inversa. La barrera alta de potencial evita que los electrones del lado n y los huecos del lado p se "derramen sobre" la unión hacia el lado opuesto; por otro lado, la presencia de la barrera favorece a los portadores minoritarios (huecos en el lado n y electrones en el lado p) para que se deslicen bajando por la pendiente de potencial hacia el lado opuesto de la unión, en donde se convierten en portadores mayoritarios. Esto reduce notablemente la concentración de portadores minoritarios cerca de la unión. Cuando se aplica una polarización directa, la altura de la barrera se reduce y los electrones de la región n, y los huecos de la región p se derraman sobre la unión convirtiéndose en portadores minoritarios en el lado opuesto. Sin embargo, también en este caso la concentración relativa de los portadores minoritarios se ve mucho más afectada que la concentración de portadores mayoritarios. 2 El resultado es que, cerca de la región de la unión, mientras que las poblaciones de electrones y huecos se caracterizan independientemente por distribuciones de Fermi, existen dos diferentes "niveles efectivos de Fermi" o "niveles quasi Fermi", uno para la población de electrones y otro para la de huecos. Estos niveles casi de Fermi se representan como e¡n para los electrones y e¡p (para los huecos) en la figura 12.5. Lejos de la unión, en la región n, la concentración de equilibrio de los huecos recibe poca influencia por el efecto de los huecos cercanos a la unión y que se deslizan por la "pendiente" de potencial hasta la región p y, por tanto, los niveles efectivos de Fermi para electrones y huecos son casi iguales. Sin embargo, conforme se acerca a la unión, la concentración local de los huecos desciende por debajo del valor de equilibrio como resultado de este efecto, en tanto que la concentración de electrones raramente se ve afectada. Entonces, como se indica en la figura 12.5 el nivel efectivo de Fermi de los electrones permanece igual en tanto que el nivel efectivo de Fermi para los huecos se eleva a partir de equilibrio, correspondiente a una concentración más pequeña de huecos en la región n cerca de la ur.ión. Se produce un efecto similar invirtiendo los papeles de los niveles casi de Fermi de electrones y huecos en la región p, al otro lado de la unión. El comportamiento de los niveles casi de Fermi de huecos y electrones debe ser algo semejante a lo que se indica en la figura. En conexión con los cálculos acostumbrados casi siempre se supone que el nivel casi Fermi de los portadores minoritarios ha llegado al valor de equilibrio asociado con la misma especie de portadores que son los mayoritarios en la región volumétrica al otro lado de la unión. Entonces, en la figura 12.5, el valor de e¡p en A casi siempre se supone igual al valor de equilibrio en el extremo izquierdo, y el valor de e¡n en B se supone idéntico al de la extrema derecha. Esto significa sencillamente que los portadores de la misma especie en las orillas opuestas de la región de carga espacial de la unión poseen la misma distribución de energía, en virtud de la eficiencia de los procesos de colisión que se producen en dicha región. Esta suposición lleva a una condición de frontera en las concentraciones de portadores de la unión que serán de gran utilidad en el siguiente capítulo. Puesto que, por ejemplo, para los electrones, la distancia entre la banda de conducción y el nivel efectivo de Fermi para electrones en el lado n es en e(cp 0 - V0 ), menor que la distancia correspondiente en el lado p como se ilustra en la figura 12.5, entonces, la 2 El requisito de neutralidad eléctrica en el material lejos de la unión, origina también una alteración en la densidad de los portadores mayoritarios. Sin embargo, puesto que la densidad de portadores mayoritarios en equilibrio es mucho mayor que la densidad de portadores minoritarios en equilibrio, la adición de un número dado de electrones y huecos puede dar como resultado un incremento en la densidad de portadores minoritarios de muchos órdenes, al tiempo que aumenta la densidad de portadores mayoritarios en sólo un pequeño porcentaje.

428

Teoría de las uniones p-n de los semiconductores

razón entre la concentración de electrones en el borde de la región de carga espacial en el lado n, y la que prevalece en el borde de la región de carga espacial en el lado p, debe estar dada por - _n.:.:."(.:. _X_:o.:. _+_:_)_ _

np( -x 0 _) -e

e(o- Vo)/kT

(12.3-1)

'

en donde las coordenadas x 0 + y - x 0 _ se refieren a la ubicación de los bordes de la región de carga espacial en los lados n y p de la unión, respectivamente. Siguiendo un razonamiento similar, las concentraciones de huecos a ambos lados debe estar relacionada por

Pi -Xo_) =

e•<o-Vo)/kT

(12.3-2)

P.(xo +)

Al escribir estas ecuaciones, se supone que la aproximación de Boltzmann es válida. El potencial y el campo eléctrico en las regiones de carga espacial se puede encontrar a partir de la ecuación de Poisson. En el caso en donde la densidad de carga varía sólo en la dirección x, la ecuación de Poisson se puede escribir como d 2
-

dx

2

4np(x)

4ne

K

K

= - - - = - - (p- 11

+ Nlx)-

N.(x)).

(12.3-3)

Para mayor facilidad, se escogerá el origen que se indica en la figura 12.5 tal que en ese punto el potencial sea cero. 3 Además, la función de potencial ¡j>(x), que contiene una constante arbitraria adicional, se definirá en relación con los bordes de la banda de conducción y valencia de tal modo que tenga la posición del nivel intrínseco de Fermi con respecro a ellos. En estas circunstancias se puede escribir (1 2.3-4) y (12.3-5}

De igual manera, ec(x) y ev(x) se relacionan con if>(x) por medio de (1 2.3-6) y (12.3-7)

Al substituir estos valores en la ecuación de Poisson (1 2.3-3), se obtiene 2
dx2

K

e-<•t.-<xl)!kT v

+ Nix)-

_U

e-<-e(x)+<,,-,1.,¡¡kr e

N.(x)).

( 12.3-8)

3 Por ahora se supone que las densidades de donadores y receptores son funciones de la distancia aunque la figura 12.5 se ha dibujado, para mayor simplicidad, como si fueran constantes.

Modelo matemático simplificado de la unión p-n abrupta

429

En casi todas las circunstancias, la solución de esta ecuación constituye un problema complejo y difícil. Este estudio se limitará a examinar varios casos particulares que pueden comprenderse en términos relativamente sencillos. Por ejemplo, sea un sistema en el que el voltaje aplicado es cero. En este caso, e¡n = e¡p = e¡, y (haciendo referencia a la figura 12.5) es evidente que, (12.3-9) de donde, (12.3-8) se puede expresar como d 2
= 4nen¡ (ee
e-etP<x)fkT _ Nd(x)

+ Na{x))

11¡

"



4nen¡ ( e
"

/..T

( 12.3-10)

11¡

Esta es la ecuación diferencial fundamental que debe resolverse para obtener el potencial tj>(x ). Para una unión abrupta se tiene que N.(x) = N.= const} Nd(x) =O

(x

<0)

(12.3-11)

N.(x) =O Nix) = Nd

(x >O)

(12.3-12)

y

}

= const

en cuyo caso, (12.3-1 O) da dos ecuaciones, una para el potencial (x < 0), de la forma

. h erp- N •) -dx2 - =4nen¡ -K - ( 2 Sll1 --+kT n¡

d 2
(x <

O)

cp_ (x)

en la región

(12.3-13)

y otra para el potencial tP+(x) en la región (x > 0), que se puede escribir como sigue dz
= 4nen¡ (2 senh e
- N

kT

d) .

(x

> O)

(12.3-14)



Estas ecuaciones se deben resolver para tP+(x) y tf>_(x) utilizando condiciones de frontera apropiadas, que se verán en la siguiente sección. Desafortunadamente, estas ecuaciones tampoco se pueden resolver con precisión por medios analíticos, de manera que se deben introducir métodos numéricos o métodos físicos aproximados. A continuación se analizará un modelo simplificado que se basa en las ecuaciones precedentes y que admite una solución matemática exacta incluso cuando se tiene un voltaje externo y que representa muy aproximadamente a la unión p-n abrupta en casi todas las circunstancias de importada práctica.

12.4

MODELO MATEMATICO SIMPLIFICADO DE LA UNION p-n ABRUPTA En ciertas condiciones, se puede obtener una solución aproximada para una

unión p-n abrupta. Obsérvese que de acuerdo con (12.3-4) y (12.3-6), la concentra-

430

Teoría de las uniones p-n de los semiconductores p(x)

eNd 1------r:-,..., \

\

~------~-~x~o~------1--------~~'------~--.x ''\

Xo+ 1

1 1

\

1

1

'

-eN0

1

j---sc -1----+sc

tipo-p Densidad de receptores Figura 12.6.

Unión N.=

const.

-.j tipo-n

Densidad de donadores Nd =const.

Densidad real de carga (curva punteada) y la densidad de carga supuesta en el modelo aproximado de la sección 12.4 (curva continua) correspondientes a una unión abrupta p-n para la que
cton de portadores varía exponencialmente en función de rp, de modo que la densidad de portadores disminuirá a un valor despreciable en comparación con el nivel volumétrico existente lejos de la unión, conforme la energía potencial del borde de la banda -erp varía por unos cuantos múltiplos de kT. Si la caída total de potencial en la unión, rp 0 - V0 , es mucho mayor que kT, habrá una variación de la energía potencial de varias veces kT que se logrará en una distancia relativamente pequeña en comparación con la extensión lineal total de la región de carga espacial de la unión. En estas circunstancias, la densidad de carga llega rápidamente a un valor constante -eNa conforme se penetra a la región de carga espacial desde la región p. y un valor constante eNd conforme se penetra a la región de carga espacial desde el lado n, como lo indican las curvas punteadas de la figura 12.6. En esta situación, un método bastante aproximado consiste en representar la densidad de carga espacial mediante un valor positivo constante eNd, tratándose de la parte del lado n que se encuentra entre la unión y el borde de la capa espacial en este lado -y no más allá-, y representarla mediante un valor negativo constante -eNa en el lado p de la unión hasta el borde de la región de carga espacial, y no más allá de este punto. De acuerdo con esta aproximación, la densidad de carga se representa mediante la línea continua de la figura 12.6. Por fortuna, la mayoría de las uniones abruptas p-n que tienen un interés práctico satisfacen la condición e(cfJo - Vo)~ kT en la que esta representación aproximada de la situación real es aceptable. Si el potencial electrostático se denota por rp+(x) para x >O, y por rp_(x) para el potencial en la región x
(12.4-1)

(-x 0 _<x<0)

(12.4-2)

Modelo matemático simplificado de la unión p-n abrupta

431

y

(x > x 0 +

;

x < -x 0 _).

(12.4-3)

Si se supone que todo el voltaje aplicado a la muestra aparece como una caída potencial en la región de la unión, entonces, en las regiones que quedan más allá de las fronteras de las capas de carga espacial el potencial debe ser constante, por lo cual,

cp+(x)

= +(x 0 +) = const

_(x)

=

_( -x 0 _)

=

(12.4-4)

const

(12.4-5)

Evidentemeate, estas soluciones satisfacen (12.4-3). Puesto que la caída total de potencial en la región de la unión es rp 0 - V 0 , se debe tener también que (12.4-6) Además, se puede demostrar fácilmente, de acuerdo con el teorema de flujo eléctrico de Gauss, que el campo eléctrico debe ser continuo en todas partes excepto en una superficie que tiene una verdadera distribución de carga superficial. Se recomienda al lector que efectúe la comprobación de este postulado como ejercicio. Esto significa que en la unión,

-E+(O) = ( -d+) = (d_) = -E_(O) = -E0 dx 0 dx 0

(12.4-7)

en donde E+(x) y E_(x) representan los campos en las regiones (x >O) y (x
y

d_ 4neNa - = - - x + B = -E_(x) dx K

(O<x<x 0 +)

(12.4-8)

(-x 0 _<x
(12.4-9)

en donde A y B son constantes arbitrarias. De acuerdo con (12.4-4) y (12.4-5), más allá de los límites Xo+ y x 0 _ de la región de carga espacial, el campo es cero y, puesto que el campo debe ser continuo en todas partes, (1 2.4-8) debe dar drp+fdx = O en Xo+ y (12.4-9) debe dar drp_jdx =O en x = -x 0 _, por lo cual, 4neNd

A = - - x0 +

y

4neNa

B=--Xo-

K

(12.4-10)

K

Y (1 2.4-8) y (1 2.4-9) se convierten en

d_ dx

4neNa

- - = - - (x 0 +- x) = -E+(x) K

(0<x<x 0 +)

(12.4-1 J)

432

Teoría de las uniones p-n de los semiconductores

y d4J_

-

dx

4rreNa

= - - (.x + x 0 _) =

(-x 0 _<x<0)

-E_(x)

(12.4-12)

K

mientxas que, por supuesto, (x > x 0 +; x < -x 0 _).

(12.4-13)

Si en (12.4-11) y (12.4-12), x se iguala a cero, entonces, haciendo referencia a (12.4-7), es evidente que 4neN.x 0 _

(12.4-14)

K

y, por tanto, que (12.4-15) De acuerdo (12.4-15), la razón de las anchuras de las dos capas de carga espacial es la inversa de la razón de las densidades de impureza respectivas. Esto implica que el número total de cargas positivas y negativas en cada capa es la misma. Al integrar una vez más (12.4-11) y (12.4-12), el potencial se obtiene como

(O<x<xo+)

(12.4-16)

(-x 0 _<x
(12.4-17)

y 2neN.

4J_(x) = - - (x K

+ x 02 _) +D.

El punto cero del potencial se puede escoger arbitrariamente; para mayor facilidad se seleccionará de tal modo que cf>+(O) = cf>_(O) =O. Si se substituye esto una vez en (12.4-16) y (12.4-17), se pueden evaluar tanto C, como D. Combinando estos resultados con (12.4-4) y (12.4-5) se ve claramente que el potencial debe tener la forma

(0 <X< Xo+) ( 12.4-18)

2neN.

4J_(x) = - - [(x K

+ x 0 _) 2

-

x~_J

(-x 0 _<x
= 'l'_.. (- Xo- ) = _ 2rreN.x~K

.

(x < -x 0 _)

Modelo 111/ltemiÍtico simplificaclo de 14 unión p-n abrupta

433

Ahora, las expresiones para el campo y el potencial han quedado completas, excepto que las distancias Xo+ y x 0 _ no se han especificado todavía. Para obtener los valores de estas cantidades, los valores de cf>+(x 0 +) y cf>_(-x 0 _) dados por (12.4-18) y (12.4-19) se pueden substituir en la condición de frontera (12.4-6), de donde, (12.4-20)

En esta ecuación, x 0 _ puede expresarse en función de x 0 + mediante (12.4-15), y la expresión resultante se puede resolver para x 0 +, lo cual da

Xo+

K((j> 0 - Vo)

=

2ne

Na Ni N d + N a)

(12.4-21)

De acuerdo con (12.4-15), x 0 _ se puede obtener en la forma (12.4-22)

Entonces, la anchura total combinada de las regiones de carga espacial es

Xo

= Xo+ + Xo- =

J

K( 4>o

- V0) ( 1 2ne Nd

1)

+ Na

(12.4-23)

y el campo E 0 en la unión, de acuerdo con (12.4-14), se puede expresar como sigue Eo

= J8ne(4>o - V0 ) K

(..!.. + ..!..) Nd

Na

1

= 2(4> 0 Xo

V0 )

(12.4-24)

Se debe hacer notar que x 0 +, x 0 _ y E 0 , están relacionadas con las densidades de impurificación Nd y Na de un modo directo, como se demostró antes, y también a través de cf>o, que es una función de Nd y Na tal y como lo expresa (12.2-5), aunque la variación logarítmica de cf>o en función de Nd y Na es mucho más lenta que la variación directa. En la figura 12.7 se presentan las gráficas de la densidad de carga espacial, el campo eléctrico y las variaciones del potencial electrostático tal y como los presenta la teoría anterior, para una polarización cero, una polarización directa (V0 >O) y una polarización inversa (V0 < 0). De acuerdo con esta figura o con las ecuaciones anteriores, es obvio que (a) La capa de carga espacial tiene mayor extensión en regiones tipo p o n levemente impurificadas, que en regiones con impurificación mayor. Para una unión dada, la capa de carga espacial se extiende más dentro de la región en la que la impurificación es menos fuerte. (b) El valor máximo de campo E 0 es muy alto en las uniones en donde las regiones p y n están fuertemente impurificadas, y mucho más pequeño en las uniones en donde una o ambas regiones están levemente impurificadas. (e) En condiciones de polarización inversa, las regiones de carga esp1cial se extienden hacia afuera dentro del cristal; la extensión cf;- las !..egion~~..!!,e _

434

Teoría de las uniones p-n de los semiconductores P(x)

E(x)

V¡¡=O

t

eNd 1----rL,------, V.> O

o 1

_j

l

V.o< O -!11 1

!

-x

! ! L--- -L-t-~-==l-

/

\ \

1

/

\

\

1

-

eNo

/ /

\Ea \

V¡¡
\ Ea

( b) 4> ( x)

'

\

/

\.-/

\

1

(a)

/ -x

/

/

/

/

Eo

V¡¡< O

------ ...... ...

'' '' --"------v;>_o______\ , \

\

\~ \

\

\

. -------

\

\ \ \ \ \

(e)

Figura 12.7.

''

' ... ... ...

Representación esquemática de (a) densidad de carga, (b) el campo eléctrico y (e) el potencial en las cercanías de una unión abrupta p-n en presencia de varios voltajes aplicados, según se calcularon de acuerdo con los métodos de la sección 12.4.

carga espacial puede hacerse muy grande en uniones en donde la región n o la p esté ligeramente impurificada. Para - V 0 ~ 1/Jo (una gran polarización inversa), la extensión de las regiones de carga espacial es proporcional a (-V0 ) 1 12 , de acuerdo con (12.4-21) y (12.4-22). (d) En condiciones de polarización inversa, el campo máximo E 0 se hace muy grande; a una gran polarización inversa, es proporcional a (- V0 ) 1 12 • Estas conclusiones, aunque se han verificado para un modelo específico de unión abrupta, son bastante gen~rales y aceptables para todas las uniones p-n de semiconductores, ya sean abruptas o graduales (aunque para uniones graduales, la dependencia de raíz cuadrada que se menciona en (e) y (d) ya no es cuantitativamente correcta). Las relaciones derivadas en las páginas anteriores son bastante exactas para las condiciones de polarización inversa; pero no debe esperarse que se apliquen perfectamente a polarizaciones directas elevadas. En este último caso, se tiene grandes flujos de corrientes y existen caídas de voltaje apreciables en las regiones volumétricas fuera de las capas de carga espacial de la unión, que hacen que la caída de voltaje

Capacitancia de unión; determinación del potencial interno

435

4> (x)

Figura 12.8.

Representación aproximada del potencial cerca de una unión abrupta p-n en condiciones de intensa polarización directa.

de dicha umon sea diferente del voltaje externamente aplicado. Entonces, el potencial adquiere una forma semejante a la que se ilustra en la figura 12.8. En la tabla 12.1 se dan algunos valores numéricos para las propiedades de las capas de carga espacial asociados con uniones p-n típicas del germanio.

12.5

CAPACITANCIA DE UNION; DETERMINACION DEL POTENCIAL INTERNO

Los resultados de la sección anterior sugieren claramente que una unión p-n se comporta en muchas formas de un modo semejante a un capacitar de placas paralelas. Se tienen dos capas de carga espacial que contienen cantidades iguales y opuestas de carga, y la cantidad de carga perteneciente a las capas aumenta conforme se incrementa el voltaje inverso. La carga asociada con un área unitaria de la región de carga espacial positiva en el lado n de la unión, es claramente el producto de la densidad de carga eNd y el volumen x 0 + de la región de carga espacial correspondiente a una unidad de área de la unión. La carga por unidad de área de capa de carga espacial negativa en el lado p, se puede calcular en la misma forma. En ambos casos, se ve claramente con la ayuda de (12.4-21) o (12.4-22), que la carga por unidad de área de unión es

(12.5-1)

Un pequeño incremento del voltaje aplicado LlV0 se verá acompañado por un cambio LlQ en la carga almacenada. Si la capacitancia diferencial por unidad de área asociada con la unión a este valor de voltaje aplicado se define como klQ/dV0 1, entonces, de acuerdo con la ecuación anterior, es obvio que

(12.5-2)

436

Teoría de las uniones p-n de los semiconductores

De acuerdo con esto, se puede llegar a la conclusión de que las uniones en las que tanto la región p como, la región n están fuertemente impurificadas, tendrán una capacitancia muy alta, en tanto que si la región n o la p o bien, ambas, están levemente impurificadas, la capacitancia será mucho menor. Para voltajes de polarización inversa que sobrepasan notablemente el potencial de contacto interno
(12.5-3) La capacitancia ppr unidad de área e se puede medir experimentalmente y se hace una gráfica de tje2 en función del voltaje inverso -V0 , como se ilustra en la figura 12.9. De acuerdo con (12.5-3), esta gráfica debe ser una recta. La intersección de esta gráfica en el eje V0 extrapolado de los datos medidos, proporciona el valor de
Figura 12.9.

Una gráfica de 1/C 2 en función del voltaje de polarización, que ilustra la determinación del potencial de contacto interno y las concentraciones de impurezas receptoras y donadoras a partir de las mediciones de capacitancia.

4 Este es casi siempre el caso en uniones producidas mediante procesos de aleación, como se verá más adelante.

TABLA 12.1. Propiedades de uniones abruptas p-n en el germanio (K = 16) N.

N.

e/> o

Vo

Xo+

Xo-

Xo

Eo

e

(cm-')

(cm- 3 )

(V)

(V)

(¡.L)

(¡.L)

(¡.L)

(kv/cm)

(f.Lffcm 2 )

10'4

10 14

0.0702

0.788 3.08 6.69 21.0 66.5

1.58 6.15 13.4 42.1 133.0

0.891 3.48 7.57 23.8 75.2

0.00898 0.00229 0.00105 0.000336 0.000106

o -1

-5 -50 -500 10'5 10'6 1017 10' 8 10' 9

10'5 10'6 10 17 10 18 10'9

0.1854 0.3005 0.4156 0.5308 0.6459

10'4

10'8

0.3005

o o o o o o -1

-5 -50 -500

0.788 3.08 6.69 21.0 66.5 0.405 0.163 0.0606 0.0217 0.0076 2.31 4.80 9.68 29.8 94.1

0.405 0.163 0.0606 0.0217 0.0076 0.00023 0.00048 0.00097 0.00298 0.00941

0.810 0.326 0.121 0.0433 0.0151 2.31 4.80 9.68 29.8 94.1

4.58 21.5 68.6 245.2 855.5

0.0175 0.0434 0.117 0.327 0.Y37

2.61 5.42 10.95 33.7 106.4

0.00613 0.00295 0.00146 0.000475 0.000151

438

Teoría de las uniones p-n de los semiconductores

de impureza a partir de (12.2-5). Se puede emplear un procedimiento similar para determinar Na y Na, incluso si las densidades de impurezas en ambos lados de la unión son comparables, aunque los aspectos matemáticos son un poco más complejos. Los detalles de este procedimiento se asignan como ejercicio para el lector. En la tabla 12.1 se muestran algunos datos numéricos de la capacitancia de estructuras de unión típicas.

EJERCICIOS l. Demuestre que existe una discontinuidad en el potencial electrostático de una magnitud 47T A en donde .::l es el momento dipolar por unidad de área, en los lados opuestos de una capa dipolar eléctrica. 2. Se intenta medir el potencial de contacto interno de una unión p-n conectando un voltímetro de alta impedancia con conductores de cobre, a contactos que se encuentran en los lados opuestos del cristal que contiene una unión. El voltímetro indica una lectura de cero. Un potenciómetro substituye al medidor, pero la lectura sigue siendo cero. Explique físicamente la falla de estos dos métodos y analice los potenciales de contacto entre el cobre y las regiones tipo n y tipo p. 3. Utilice el teorema del flujo eléctrico de Gauss para demostrar que el campo eléctrico debe ser continuo en todas partes excepto en una superficie que tiene una distribución de carga. 4. Explique físicamente por qué el ancho de la región de carga espacial de una unión abrupta p-n es proporcional a la raíz cuadrada más que a la primera potencia de la caída de potencial de la unión 1/>o- V0 • 5. Encuentre expresiones aproximadas para los potenciales, los campos y el ancho de las capas de carga espacial asociadas con una unión linealmente gradual en la que

Nd = O, N. N.

=

= -

cxx

O, Nd = cxx

(x < 0) (x >0)

donde a es una constante. Suponga que la caída total de potencial en la región de carga espacial es 1/Jo- Vo y que 1/Jo- Vo ~kT. Nota: use una extensión de los métodos expuestos en la sección 12.4. 6. Encuentre la capacitancia diferencial por unidad de área asociada con la unión linealmente gradual del ejercicio 5. 7. Demuestre la forma en que el potencial de contacto interno y Na y Na se pueden obtener a partir de una gráfica de datos experimentales como la que se muestra en la f¡gura 12.9. Derive fórmulas explícitas para Na y Na en función de la pendiente de la gráfica experimental y el potencial interno 1/>o.

LECTURAS RECOMENDADAS J. D. Jackson, Classical Electrodynamics, John Wiley & Sons, Nueva York (1962), capítulo l. Allen Nussbaum, Semiconductor Device Physics, Prentice-Hall, Inc., Englewood Cliffs N. J. (1962), capítulo 4. W. Shockley, Electrons and Holes in Semiconductors, D. van Nostrand Co., Inc., Nueva York (1950). R. A. Smith, Semiconduc10rs, Cambridge University Press, Londres (1961), E. Spenke, Electronic Semiconductors, McGraw-Hill Book Co., lnc., Nueva York (1958).

CAPITUW

13

Rectificadores de unión p-n • y transiStores . 13.1

TEORIA DEL RECTIFICADOR DE UNION p-n

En el capítulo anterior se examinó la naturaleza física de una unión semiconductora p-n. También se analizaron cuantitativamente ciertas manifestaciones físicas de la estructura de la unión, tales como la carga espacial, los campos eléctricos, los potenciales y la capacitancia, basándose en un simple modelo de unión abrupta. En esta sección se verá el flujo de corriente asociado con la unión en condiciones de desequilibrio y la característica de corriente-voltaje de un simple rectificador de unión p-n. El modelo de unión que se adoptará se ilustra en estado de equilibrio en la figura 13 .1. Se supone que las regiones tipo p y n son homogéneas y se P.xtienden al infinito en las direcciones + x y - x. En el estado de equilibrio habrá cierto número de electrones presentes como portadores mayoritarios en el lado n, que tienen la suficiente energía para saltar la barrera de potencial y difundirse en el lado p de la unión. En la región p, estos electrones constituyen portadores minoritarios y

f-ec#>

-- - - -- -+ + + + + ++ + +

+

+ +

Carga espacial Jp,-

tipo-p Figura 13.1.

-

Vo= O

+ +

+

=

~e

.,

--x

+ -Jp,

+

+

••

ti po-n

Diagrama de potencial de una unión p-n en condición de equilibrio, en donde se muestran las distribuciones de portadores de carga y los flujos de generación y recom binación.

440 Rectificadores de unión p-n y transistores pueden, después de cierto tiempo, desaparecer mediante su recombinación con huecos. Por tanto, en equilibrio se tiene una corriente de electrones de la región n, pasando sobre la unión, hasta la región p, en donde se pierden por recombinación. Este flujo electrónico de equilibrio se citará como flujo de recombinación lnr· Sin embargo, se obvio que en la condición de equilibrio no puede haber un flujo neto de corriente; es más, de acuerdo con el principio del balance detallado, en estado de equilibrio, cualquier proceso microscópico de transporte y su inversa deben proceder a la misma velocidad. La inversa de este proceso en particular es la generación de pares electrón- hueco en el lado p de la unión, y la difusión subsecuente de electrones a través de la unión hacia el lado n, en donde se convierten en portadores mayoritarios. Este proceso inverso conduce a una corriente electrónica que fluye de la región p a la región n y que se denominará corriente de generación. En estado de equilibrio, el flujo de partículas resultante Jng debe ser exactamente igual a -Jnr· Estas mismas observaciones se aplican a los huecos por igual; existe un flujo de recombianción Jpr que se origina cuando los huecos de la región p se desplazan sobre la barrera hasta la región n, en donde se recombinan con electrones. Esto va acompañado por un flujo de generación Jpg que se crea mediante la generación térmica de pares en la región n, seguida de la difusión de huecos térmicamente generados a través de la unión. En estado de equilibrio se debe tener J ng = - J nr· Por tanto, en estado de equilibrio los flujos totales de huecos y electrones a través de la unión son igual a cero. La base para la acción de una unión p-n como rectificador es como sigue. En condiciones de polarización inversa, la altura de la barrera de potencial en la unión aumenta en una cantidad igual a -e V 0 , en donde V 0 es el voltaje aplicado. En estas condiciones, es difícil para los portadores vencer la barrera por difusión y, por ende, J nr y J pr se hacen muy pequeños; sin embargo, los flujos J ng y J pg dependen sólo de la velocidad de generación térmica de pares electrón-hueco en las regiones volumétricas respectivas y, en consecuencia, no se ven reducidos. Por tanto, conforme se incrementa el voltaje de polarización, la densidad de corriente a través -eq, -eq,

_ tipo-n

V0
+++++++ ++++++ + + + + + + +

-x

+

+

tipo-p

+ ~-----.,.+
Unión (a)

Figura 13.2.

+

+

-Jpg

Jp,---·

tipo-p

+

+ -Jpg

Unión

tipo-n

( b)

Diagrama de potencial de una unión p-n (a) con polarización inversa, (b) con polarización directa, en donde se señala cómo se modifican los flujos de generación y recombinación.

Teoría del rectificador de unión p-n

441

de la unión tiende a un valor pequefio constante -e(Jpg- lng), denominado co"iente de saturación, que está limitada por el número de pares térmicamente generados que se crean en las regiones volumétricas cerca de la unión. Esta corriente depende sólo de parámetros del material y la temperatura, y no puede aumentar notablemente, no importa el alto valor que puede adquirir el voltaje. Esta situación física se ilustJ;a esquemáticamente en la figura 13.2(a). Cuando se aplica un voltaje de polarización directo, la altura de la barrera de potencial se reduce y es muy fácil para los electrones mayoritarios del lado n y los huecos mayoritarios del lado p, difundirse sobre la barrera hacia los lados opuestos respectivos en donde pueden convertirse en portadores minoritarios y, finalmente, recombinarse. En este caso, las corrientes de recombinación Jpr y lnr pueden hacerse muy grandes en comparación con sus valores de equilibrio. No obstante, las corrientes de generación lng y Jpg permanecen iguales, ya que están limitadas por la velocidad de generación térmica. El resultado es un gran flujo de corriente, como se ilustra en la figura 13 .2(b ). La estructura de la unión presenta una impedancia muy elevada en la dirección de polarización inversa y una impedancia muy pequefia en la dirección de polarización directa, por lo que se comporta como un rectificador. En la figura 13.3 se muestra la relación corriente-voltaje. En la condición de polarización inversa se originan flujos de corriente de saturación consistentes en portadores minoritarios generados de un modo térmico en las regiones volumétricas que quedan fuera, pero son adyacentes, a las capas de carga espacial de la unión y que la barrera de potencial de la unión se encarga de recoger. En la condición de polarización directa, la corriente se compone en su mayor parte de portadores mayoritarios que se difunden sobre la barrera reducida para convertirse en portadores minoritarios en la región de conductividad opuesta, al otro lado de la unión; en efecto, la unión inyecta un gran número de portadores minoritarios hacia las regiones volumétricas adjuntas a ambos lados. Puesto que el número de electrones que poseen la energía suficiente para sobrepasar la barrera de potencial de la unión es proporcional a e-e(v>o- Vo)fkT = (const)eeVofkT (suponiendo que la estadística de Maxwell-Boltzmann es válida), es de esperarse que Jnr y Jpr sean proporcionales a eeVofkT. Sin embargo, para V0 =O, Jpr =Jpg Y Jnr =1n 1p de donde, se tiene que y

= J pge•VofkT

(13.1-1)

J nr = J ng e•VofkT •

(13.1-2)

J pr

l

Figura 13.3.

Relación corriente-voltaje de una unión p-n, con la región de ruptura inversa.

442

Rectificadores de unión p-n y transistores Entonces, de acuerdo con la figura 13.2, (13.1-3}

y

(13.1-4¡ La relación entre el voltaje aplicado y la densidad de corriente eléctrica 1 estará dada por (13.1-5) en donde la densidad de corriente de saturación 10 es la suma de las densidades de corriente de generación (13.1-6} La relación que existe entre la corriente y el voltaje que aparece en la figura 13.3 es una gráfica de la ecuación (13.1-5) antes mencionada. A continuación se procederá a sacar el resultado (13.1-5) por medio de un método de cálculo más riguroso que cuenta con dos ventajas: la primera, que proporciona una expresión más explícita de la corriente de saturación y, segunda, que forma la base para la técnica de cálculo que se puede aplicar a dispositivos de unión más complicados. El procedimiento que se seguirá consiste en resolver la ecuación de continuidad para los portadores en exceso, tanto en la región n, como en la p, y aplicar las condiciones apropiadas de frontera a la unión y a todas las demás partes del sistema. Con este fin se supondrá que la unión es planar y que el plano de unión se extiende esencialmente al infinito en las direcciones y y z, de tal manera que sólo se requiere tomar en cuenta las variaciones de concentración de portadores y el flujo de corriente a lo largo de la dirección x. También se supondrá que se ha llegado a un estado estacionario y que todo el voltaje aplicado al sistema aparece en la región de carga espacial asociada con la unión. Las caídas de voltaje y los campos eléctricos en el material que se encuentra fuera de la región de la unión son, por tanto, despreciables y el transporte en dichas regiones es puramente difusivo. En estas condiciones. las ecuaciones de continuidad para los electrones de la región p y los huecos de la región n, tienen la forma

(región-p, x < -x 0 _)

(13.1-7)

(región-n, x > x 0 +)

(13.1-8)

y

en donde, y

(13.1-9)

Como de costumbre, sólo se tratan explícitamente las ecuaciones de continuidad para portadores minoritarios en cada región; pero se debe recordar que existe un exceso de concentración de electrones en todas partes, dentro de la región n, que es igual a la concentración local de huecos en exceso, y una concentración de huecos

Teoría del rectificador de unión p-n 443 en exceso en toda la región p, que es igual a la concentración local de electrones en exceso, con el fin de que se satisfaga el requisito de neutralidad eléctrica. La fuente última de estos portadores mayoritarios excedentes la constituyen los contactos extremos del dispositivo (que están alejados de la unión en el modelo más o menos idealizado que está considerando). En cierto modo, la inyección de una distribución de portadores minoritarios da como resultado la formación inmediata de una distribución adjunta de portadores mayoritarios que vacía el resto del dispositivo de este tipo de portadores, creando instantáneamente un campo que atrae a los portadores mayoritarios neutralizantes hacia adentro, desde el contacto extremo. En la condición de estado estacionario se mantiene una neutralidad aproximada en todas partes excepto dentro de la región de carga espacial de la unión. Las condiciones de frontera que van a usarse indican lejos de la unión que la densidad de portadores minoritarios excedentes debe tender a cero, de donde, para

X=

-oo ,

(13.1-10)

X=

+oo

(13.1-11)

y

para

Pn- Pno =O

en tanto que las condiciones de frontera (12.3-1) y (12.3-2) desarrolladas en el capítulo anterior deben satisfacerse en la unión. El uso de estas condiciones de frontera simplifica el análisis, si se supone que la densidad de portadores en exceso es mucho más pequeña en todas partes que la densidad de portadores mayoritarios en equilibrio. Es evidente que esta condición se satisfará siempre en el dispositivo a todos los voltajes de polarización directa, excepto los muy grandes. Si se hace esta suposición, ent;:mces, en (12.3-1) nn(Xo+) puede igualarse a nno• mientras que en (12.3-2), Pp( -x0 _) puede considerarse 1 igual a Ppo. Entonces, estas condiciones de frontera toman la forma np{ -Xo-)

=

e-e(+o-Vo)/kT

nno

(13.1-12)

y e -e(+o-Vo)/kT.

(13.1-13)

Las soluciones generales de las ecuaciones de continuidad (13.1-7) y (13.1-8) se pueden expresar como (región-p)

(13.1-14)

(región-n)

(13.1-15)

y

en donde A, B, C y D son constantes arbitrarias. Se puede ver claramente que, para satisfacer las condiciones de frontera (13.1-10) y (13.1-11), es necesario determinar que B = C =O. Así también, puesto que cuando el voltaje aplicado V0 es cero, 1

De otra manera, sería necesario escribir nn(Xo+)=nno+fpn(Xo+>-Pno] y Pp(Xo-)=

Ppo +[np(- xo_)- npo].

Rectificodores de unión p-n y transistores

444

np(-x 0 _)=npo y Pn(Xo+)=Pno• como lo indican (13.1-12) y {13.1-13), la cantidad e-e4>o/kT se puede expresar -en función de la relación de las concentraciones de equilibrio de huecos y electrones en los lados opuestos de la unión2 , como sigue e-e+ofkT

= npo = Pno nno

(13.1-16)

Ppo

Esto permite expresar las condiciones de frontera {13.1-12) y {13.1-13) en la forma n P(-x o- )

= n pO eeVofkT

(13.1-17)

y

(13.1-18) Si se hace que B = C= O, en {13.1-14) y {13.1-15), y se aplican {13.1-17) y {13.1-18) para evaluar las otras dos constantes, se puede demostrar fácilmente que np - npo = npo(eeYo!kT - 1)e(x+xo-l/Ln

(región-p)

(13.1-19)

{región-n)

(13.1-20)

y Pn- Pno

= Pno(eeVofkT- 1)e-(x-xo+l/Lp

Estas ecuaciones permiten ver que para una polarización inversa {V0 0). Las ecuaciones {13.1-19) y {13.1-20) se pueden emplear para encontrar las corrientes de huecos y electrones que fluyen dentro de las regiones de carga espacial desde el lado n y el lado p del cristal, respectivamente. Se supondrá que la corriente de electrones que cruza la unión es la misma que la corriente de electrones minoritarios que fluye dentro de la región de carga espacial, desde el lado p, y que la corriente de huecos que cruza la unión es igual a la corriente de huecos minoritarios que fluye dentro de la región de carga espacial, desde el lado n. Al hacer esto, se está desechando cualquier generación o recombinación térmica de portadores que pueda ocurrir dentro de la capa de carga espacial propiamente dicha. 3 Esto se justifica por el hecho de que el espesor de la capa de carga espacial es, en la mayoría de los casos, muy pequeño y los campos muy altos dentro de la capa de carga espacial aceleran casi siempre a los electrones desde el lado p, y a los huecos desde el lado n, para que atraviesen la capa en un intervalo muy pequeño en comparación con sus tiempos de vida. Al hacer esta simplificación, la corriente de unión se puede evaluar determinando las corrientes de difusión de los portadores minoritarios en las fronteras de la región de carga espacial, lo cual da Esto se establece también fácilmente a partir de (12.2-3) ó (12.2-4). Si no se efectuara esta aproximación, las ecuaciones de continuidad (incluyendo los términos apropiados del campo} tendrían que resolverse en las dos capas de carga espacial e igualarse con las soluciones de fuera, como las expresan (13.1-19) y (13.1-20) en x 0 + y - x 0 _ con condiciones de frontera adecuadas. En este caso, el cálculo será más díficil, aunque más general. 1

3

Teoría del rectificador de unión p-n JiO}~Jn(-Xo_)=

n 0 D"(eeVo/kT -1} = _ __f!____L

dndP) -Dn ( X

y

-xo-

(dp")

J p(x O+ ) = -D p d J p(O),.., =

X

(13.1-21)

n

= PnoDp L (eeVofkT _ l} . XO+

445

(13.1-22)

p

La corriente eléctrica que cruza la unión es, entonces, 1 = e(Jp(O)- Jn(O))

= e(nP~~n + Pn~~P)(eeVo/kT-

1).

(13.1-23)

Este resultado tiene la misma forma que el que se obtuvo anteriormente como (13.1-5); ahora, la corriente de saturación es (13.1-24) Las concentraciones reales de huecos y electrones a ambos lados de la unión, tanto para la polarización directa como para la inversa, se muestran en la figura 13.4 para un rectificador típico de unión p-n del tipo que se acaba de describir. De acuerdo con la ecuación anterior, se encuentra que la corriente de saturación incluye las densidades de equilibrio de portadores minoritarios npo y Pno los coeficientes de difusión Dn y Dp, así como los tiempos de vida de los portadores en exceso a través de las longitudes de difusión Ln y Lp. Esto se puede expresar en función de las densidades de portadores mayoritarios aplicando la relación (13.1-25) en donde, (13.1-23) se puede expresar en la siguiente forma

(13.1-26)

Parece que la corriente de saturación se puede reducir mediante el uso de un material con impurificación relativamente fuerte en la región n y p, y también haciendo que el tiempo de vida de los portadores en exceso sea lo más grande posible en ambas regiones. De acuerdo con (13.1-26}, la corriente de la saturación depende de la temperatura a través d¡: Dn, Dp, Ln, Lp y n¡. De estos parámetros, el más sensible a la temperatura es la densidad de portadores intrínsecos n¡ y, por tanto, la corriente de saturación debe aumentar rápidamente al incrementarse la temperatura. Los semiconductores que tienen bandas de energía prohibida relativamente grandes (y, por ende, valores más o menos pequeños de n¡), son convenientes para elaborar rectificadores de unión p-n que deban manejar densidades elevadas de corriente y operar a altas temperaturas. En estas condiciones de operación, la densidad de portadores intrínsecos dentro del semiconductor con esa banda pequeña se hace excesiva y la corriente de saturación adquiere un gran valor, lo cual da como resultado una eficiencia pobre de rectificación y una generación excesiva de calor en la región de polarización inversa, como se muestra en la figura 13.5. En consecuencia, los rectificadores de silicio son superiores a las unidades de germanio para aplicaciones de alta corriente o alta temperatura. Desafortunadamente, la baja

446

Rectificadores de unión p-n y transistores Concentración

Concentración

Déficit electrónico tipo-p Región de la unión (a) Polarización directa Figura 13.4.

Déficit de huecos

. tlpO-n Región de la unión (b) Polarización inversa

np(x)



Concentraciones de electrones y huecos en la cercanía de una unión p-n (a) con polarización directa y (b) con polarización inversa.

corriente de saturación ele los semiconductores de bandas prohibidas grandes, a temperaturas bajas, produce una impedancia más alta en el estado de polarización directa y, por ende, una gran caída de voltaje directo para una corriente dada. Esto representa una mayor pérdida de potencia dentro del dispositivo y una generación de calor interno superior en condiciones de corriente pequeña. Por esta razón muchas veces se prefiere usar rectificadores de germanio cuando se tiene como requisito una baja caída de voltaje en sentido directo a corrientes bajas, y cuando no es importante un buen funcionamiento en condiciones de alta corriente y alta temperatura. Las fracciones ele la corriente total de unión portada por electrones y huecos se menciona a veces como las eficiencias de inyección de electrones y huecos, respectivamente. De acuerdo con (13.1-21) y (13.1-22), es obvio que estas cantidades están dadas por (13.1-27)

(13.1-28)

En una umon simétrica, en donde Pp 0 = nn 0 , las corrientes de electrones y huecos son aproximadamente iguales, a condición de que la relación de movilidad b sea del orden de la unidad y que Ln y Lp no difieran en gran manera. Sin embargo, en un dispositivo asimétrico en el que una región está más fuertemente impurificada que la otra, las expresiones anteriores demuestran que casi toda la corriente que

Corrientes y campos en los rectificadores de unión p-n

447

IVc, Potencia

Corriente alta de 1saturación

Región de ruptura

Figura 13.5.

Corriente baja de saturación

Disipación de potencia de un rectificador de unión p-n en función del voltaje aplicado.

fluye por la umon es transportada por el portador que constituye el elemento mayoritario dentro de la región fuertemente impurificada. Desde el punto de vista físico esto es cierto, ya que los portadores mayoritarios de la región con impurificación leve que, por ejemplo. podrían inyectarse dentro de la otra región si se aplicara una polarización directa, existen en una cantidad reducida en comparación con los portadores mayoritarios dentro de la región de gran impurificación que, en condiciones similares, podrían inyectarse hacia el lado de impurificación ligera. Más tarde se verá que la eficiencia de inyección de la unión del emisor es un factor importante en la ganancia de un transistor de unión. Si el voltaje de polarización inversa aplicado a un rectificador de unión p-n se incrementa uniformemente, se llegará a un punto en el que la corriente inversa aumenta de un modo repentino y abrupto, como se ilustra en las figuras 13.3 y 13.5. Este fenómeno se conoce como ruptura y el voltaje al que se produce se denomina voltaje de ruptura del dispositivo. Si éste funciona mucho más allá del punto de ruptura, se generará internamente una gran cantidad de calor, ya que tanto I como IVo 1son grandes y puede fundirse o quemarse en un lapso muy corto. En el siguiente capítulo se presentará un breve estudio de los mecanismos típicos que intervienen en la ruptura de los rectificadores de unión p-n.

13.2.

CORRIENTES Y CAMPOS EN LOS RECTIFICADORES DE UNION p-n

Para obtener los resultados de la sección anterior, se supuso que todo el transporte de portadores de carga en las regiones volumétricas p y n adyacentes a la región de carga espacial de la unión es puramente difusivo. La justificación física de esta suposición es que casi todo el voltaje aplicado a un dispositivo de unión p-n aparece en la región de carga espacial de la unión que está casi vacía de portadores de carga y, en efecto, tiene una resistividad mucho mayor que las regiones situadas a ambos lados. No obstante, se verá que en realidad los resultados obtenidos, contradicen la suposición; es necesario tratar de determinar si esta contradicción es lo suficiente-

448 Rectificadores de unión p-n y transistores mente grave para que se abandone este planteamiento y vuelva a comenzarse desde el principio. Como se verá, en la mayoría de los casos no sucede esto. Por ahora, la atención se deberá enfocar en la región n del dispositivo (x > x 0 +)· Obviamente, en esta sección del dispositivo, los flujos de partículas Jn y JP se pueden expresar como Jn

dn,.

= -Dn "E dx - nnrn

(13.2-1)

y (13.2-21

en donde E es el campo eléctrico que hasta ahora se ha despreciado. Del mismo modo, puesto que no existen fuentes ni escapes para la corriente eléctrica dentro de la región volumétrica, es necesario tener, en el estado estacionario, como ecuación de continuidad para la densidad de corriente eléctrica 1,

op

(13.2-3)

--=V·I=O

at

en donde p es la densidad de carga. En el sistema unidimensional que se está viendo, esto significa que dl/dx =O,

ó

l(x) = e(Jp(x)- Jix)) = const.

(13.2-4)

Las expresiones de corriente de partículas (13.2-2) se pueden transformar en una expresión algo más útil haciendo notar que, debido a la condición de neutralidad eléctrica ~n = ~p. la densidad de portadores mayoritarios se puede escribir como sigue (13.2-5)

de donde, dn,.

dp,.

dx

dx

(13.2-6)

-=-

Cuando se substituyen estas relaciones en (13.2-1) y (13.2-2), se insertan las ecuaciones resultantes en la expresión de continui~ad (13.24) y, resolviendo para el campo E, se obtiene dp,. 1- eDp(b- 1) -d-x E=-~--~--~-~

eJJ.p[bn,.o

+ b(p,. -

Pno)

+ p,.].

(13.2-7)

Los resultados obtenidos en la sección anterior en la forma de las ecuaciones (13.1-20) y (13.1-23), suponiendo que el efecto de los campos eléctricos en la región volumétrica n del dispositivo, que queda fuera de la región de carga espacial, puede ser despreciable en comparación con el efecto del transporte difusivo, se pueden substituir ahora en (13.2-7) para corroborar la consistencia de los resultados

Corrientes y campos en los rectificadores de unión JH1

449

con la supos1c1on. En el capítulo 10 se demostró que, en general, un campo eléctrico no altera el carácter difusivo del perfil de concentración, a menos que se sobrepase el valor crítico dado por (10.244). Si &e observa que los coeficient&' de transporte ambipolar apropiados son Dp y IJ.p, y si se usan (13.1-9) y (10.2-11), esta condición se puede expresar como kT (13.2-8) IEI~-. eLP Si los valores de Pn e 1 dados por (13.1-20) y (13.1-23) se substituyen en (13.2-7), esta ecuación toma la siguiente forma E_ - qo

+

lo+ epnoDp (b- 1)e-<x-xo+)/Lp LP . (eeYo/kT _ 1) Pnoep-p(b + 1)(eeYo/kT- 1)e (x xo+)/Lp

(13.2-9)

en donde a0 = ep.p(pn 0 + bnno) es la conductividad de equilibrio del material tipo n y en donde 10 está dada por (13.1-24). Para V 0 =O, desaparece el campo dado por (13.2-9); para voltajes de polarización lo suficientemente pequefíos, ya sean directos o inversos, se satisfará la condición (13.2-8). En general, en el rango de polarización inversa, el factor (eeVofkT- 1) debe tener valores entre cero y -1. Puesto que el segundo término del denominador anterior es casi siempre pequefío en comparación con a0 para cualquier valor de polarización inversa, debido al hecho de que nno ;;¡¡:.. Pno• la magnitud del campo aumentará cuando se incremente la polarización inversa, llegando a un valor máximo para V 0 ~- oo. En estas condiciones, despreciando el segundo término del denominador por la razón que se acaba de citar, (13.2-9) adquiere la forma 1

p D (b- 1)e-<x-xo+)/Lp

E=~+nOp

qo

JliPno

+ bnno)

.

(13.2-10)

Si se usan (13.1-24) y (10.2-11), esto se puede transformar en kT Pno[1- (b- 1)e-<x-xo+)/Lp] E=-· eLP Pno + bnno

+ bnpo ~P n

(13.2-11)

Si Lp -Ln y b -1, la condición (13.2-8) debe satisfacerse en todas partes dentro de la región n para todos los valores de polarización inversa, ya que si el material dentro de esta región es bastante extrínseco, nno ;;¡¡:.. Pno, npo. Todos estos resultados coinciden con la hipótesis original de que el campo era tan pequefío que podrían desecharse los efectos de todos los transportes excepto el difusivo. Para valores grandes de polarización directa eeVofkT se hace grande y positivo. En estas cucunstancias, el segundo término del denominador de (13.2-9) puede hacerse tan grande o mayor que el primero . Dentro del límite de un gran voltaje en directo4 en el borde de la región de carga espacial (x = x 0 +), (13.2-9) se reduce a E_ kT b - eLP b + 1

(t + Pno npo LP) Ln

(13.2-12)

4 Por supuesto, en estas circunstancias los coeficientes de transporte ambipolar (10.2-27) y (10.2-28) deben usarse en las ecuaciones de continuidad, ya que las concentraciones de portadores excedentes pueden ser mayores que la densidad de portadores mayoritarios en equilibrio. Sin embargo, para materiales donde b es del orden de la unidad, la discrepancia no será lo suticientemente grande como para invalidar las conclusiones cualitativas que se han derivado.

450 Rectificadores de unión p-n y transistores

y es evidente que (13.2-8) ya no se satisface. En estas circunstancias el papel del campo puede ser muy importante. En consecuencia, no debe esperarse que la ley de la corriente y el voltaje (13.1-23) se obedezca a grandes voltajes de polarización directa. Aunque sólo se ha investigado en detalle la región n del dispositivo, es obvio que se pueden hacer las mismas observaciones en relación con la región p. Ya se ha verificado la corrección fundamental del uso de los perfiles de concentración puramente difusivos (13.1-19) y (13.1-20) en casi todas las condiciones para describir la distribución de portadores en exceso en las regiones n y p de un rectificador de unión p-n. Ahora es necesario, para completar el cuadro, justificar la suposición de que la co"iente de portadores minoritarios que fluye dentro de la región de carga espacial de la unión es puramente de tipo difusivo. Esto se puede lograr de una manera muy similar. También en este caso, considerando en particular la región n del dispositivo, (13.2-2) deja ver que la componente difusiva de la corriente de huecos es mucho mayor que la componente de arrastre, siempre que (13.2-13) en donde E está dado por (13.2-9). Si en esta ecuación se substituyen (13.1-20) y (13.2-9), el resultado es D Lp e-<x-xa+)/Lp

~

J.lp(l

+ (eeYo/kT-

l)e-<x-xa+)/Lp)

p

(13.2-14)

Lejos de la umon (x ~xo+), los factores e<x-xo+)/Lp se hacen extremada· mente pequeños y (13.2-14) se reduce a (13.2-15)

y es obvio que se viola la condición (13.2-13). Por supuesto, esto es de esperarse desde el punto de vista puramente físico, ya que por ejemplo, en el caso de la polarización directa, los portadores minoritarios excedentes que se inyectan en la unión se recombinan con portadores mayoritarios cuando se difunden cada vez más lejos de la unión y por esta razón su concentración se hace extremadamente pequeña cuando están lejos del plano de la unión. Sin embargo, si la concentración de portadores minoritarios en exceso se hace pequeña, lo mismo sucede con su gradiente y la corriente de difusión que es proporcional a ella. No obstante, la corriente total debe ser la misma en todas partes de acuerdo con (13.2-4). El déficit resultante en la corriente de difusión lejos de la unión se contrarresta mediante el incremento correspondiente en la corriente de arrastre que se origina debido a la presencia de un campo eléctrico. En efecto, es evidente, a partir de (13.2-9), que cuando se está lejos de la unión el campo eléctrico E se acerca a un valor constante J0 (ef!Vo/kT- 1)/ a 0 dando origen a una corriente de arrastre puramente óhmica, libre de cualquier componente de difusión o efecto de portadores en exceso dentro de esta región. Esto es precisamente lo que la intuición indicaba.

Corrientes y campos en los rectificadores de unión p-n

4S 1

Por supuesto, más cerca de la unión, parte de la componente de arrastre da origen a una corriente de difusión y, en la unión misma, con contribución relativa de la componente difusiva puede valorarse haciendo x = x 0 + en (13.2-14), por lo cual, esa desigualdad se reduce a

(13.2-16)

Si se sigue una línea de razonamiento similar a la que se usó previamente en relación con (13.2-14), se puede demostrar que cuando LP -Ln y b,.., 1, (13.2-16) se satisface a todos los valores de volt.tje de polarización inversa y para pequeños voltajes de polarización directa. También, al igual que antes, para grandes voltajes de polarización directa, esta condición puede violarse. Nuevamente (excepto a grandes valores de polarización directa) estos resultados son consistentes con el punto de vista original, de que casi toda la corriente de portadores minoritarios que fluye hacia la región de carga espacial de la unión es de difusión. El resultado se ha comprobado explícitamente sólo para la región n; pero es evidente que pueden formularse conclusiones similares para la región p. De donde, se justifica la conclusión establecida de que, aunque los resultados de los cálculos de la sección anterior revelen que hay campos eléctricos en las regiones volumétricas, en contradicción con la hipótesis original en la que se basaron dichos cálculos, en la región de polarización inversa o baja polarización directa, los campos son tan reducidos que no hay contradicciones importantes a la suposición del transporte difusivo de los portadores minoritarios. 5 Los cálculos realizados en estas circunstancias son totalmente congruentes. Para valores mayores de voltaje de polarización directa, los campos calculados se hacen tan grandes que amenazan esta congruencia y ya no se puede tener la seguridad de que siga siendo válida la suposición inicial de que el transporte de portadores minoritarios es puramente difusivo dentro de las regiones volumétricas p y n del dispositivo. En el siguiente capítulo se estudiarán las propiedades de los rectificadores p-n en estas condiciones de un modo más detallado. Ya se hizo notar en relación con (13.2-15), que dentro de las regiones volumétricas, las componentes difusiva y de arrastre de la corriente total no son iguales en todas partes a pesar de que la corriente total propiamente dicha es constante en ellas. Se puede hacer la misma observación sobre las componentes de la corriente de huecos y electrones. Por ejemplo, de acuerdo con la figura 13.4(a), es obvio que en el lado n cerca de la unión, la corriente de huecos es mucho mayor (en vista de la gran componente difusiva) que lejos de la unión, en donde los huecos escasean y en donde la corriente de huecos es casi exclusivamente de arrastre. En vista del requisito de que la corriente total sea la misma en todas partes, es evidente que la corriente electrónica cerca de la unión debe ser correspondientemente más pequeña que lejos de ella en la parte volumétrica del cristal. Este equilibrio se mantiene por medio del campo E, dado aproximadamente por (13.2-9), que tiene un efecto mucho más importante en las corrientes de portadores mayoritarios (debido al número mucho mayor de portadores mayoritarios presentes), que en las corrientes de portadores minoritarios que, como se demostró antes, tiene una naturaleza más bien difusiva.

S Por supuesto, en algunos casos y debido a las caídas óhmicas dentro de las regiones volumétricas p y n, ya no se podrá identificar a V0 como el voltaje total aplicado, sino sólo como la caída que se produce en la región de la unión.

452

13.3

Rectificadores de unión p-n y transistores

RECTIFICADORES DE UNION DE TAMAÑO FINITO; EFECTOS DE SUPERFICIE Y TERMINALES OHMICAS

Los resultados de la secc10n anterior, aunque se derivaron para un dispositivo de extensión infmita a lo largo del eje x, se pueden aplicar perfectamente a dispositivos de tamaño finito, con la única condición de que las regiones reales n y p sean muchas veces más gruesas que las longitudes de difusión respectivas Lp y Ln, y que la cantidad V 0 se considere como el voltaje aplicado a la región de carga espacial de la unión y no como el voltaje aplicado a todo el dispositivo. Si los espesores de una o las dos regiones volumétricas adyacentes a las capas de carga espacial de la unión son del orden de la longitud de difusión en dicha región, o menores que ésta, es necesario modificar las cálculos de la sección 13.1. Para ver cómo se hace, estúdiese primero el rectificador que aparece en la figura 13.6(a), en donde la estructura del dispositivo se termina por medio de dos superficies libres con velocidades de recombinación superficial sp y sn. Se supone que el dispositivo es grande en las direcciones y y z, de tal manera que se pueden escribir ecuaciones de continuidad unidimensionales de la forma (13.1-7) y (13.1-8). Aunque la forma general de las soluciones tal como la expresan (13.1-14) y (13.1-15) sigue siendo válida, es más conveniente escribir las soluciones como sigue np- npo =

A cosh

p.- P.o = C cosh

X+ X 0 _

L. X- Xo+

LP

+ B senh

X+ Xo-

L

(x
(13.3-1)

n

+ Dsenh

X- Xo+

L

(x

> 0).

(13.3-2)

P

Se puede demostrar fácilmente que estas soluciones satisfacen las ecuaciones (13.1-7) y (13.1-8). Las condiciones de frontera (13.1-17) y (13.1-18) siguen siendo aplicables en los bordes de la unión en x 0 + y en - x 0 _; pero ahora, las condi· ciones de frontera (13.1-10) y (13.1-11) deben substituirse con las condiciones super· ficiales de frontera (13.3-3) y (13.3-4) Al igual que antes, las anteriores ecuaciones de continuidad se pueden resolver con las nuevas condiciones de frontera, para obtener la concentración de portadores en exceso y las corrientes de difusión de portadores minoritarios en los bordes de las regiones de carga espacial de la unión se pueden encontrar y combinar exactamente como se hizo en la sección 13.1, para obtener la corriente total que fluye por la unión. En ambos casos se hacen las mismas aproximaciones con respecto al transporte difusivo de portadores y desechando la generación y recombinación dentro de la región de carga espacial. Al utilizar las condiciones de frontera (13.3-3) y (13 .3-4) los resultados del cálculo son

Pn- Pno

= Pno ( eeYo/kT -

>[

1 cosh

X-Xo+

LP

- (. senh

X-Xo+]

LP

(región-n)

(13.3-5)

Rectificadores de unión de tamaño finito

dp

+ 1

q,-x +x x 0_

0

1

Superficie, velocidad de recombinación Sp

-sc +se

1

1

dn

1

d.-x

0

1

0+

tipo-p Contacto metálico "óhmico"

1 l

Superficie, velocidad de recombinación s.

1 1 tipo-n

tipor

1 x=O

1 1 1

X 0-

_j x=O

Unión

metálico "óhmico" -x

--x

Unión

(a) Figura 13.6.

453

(b)

(a) Geometría del rectificador fmito p-n que se vio en la sección 13.3. (b) Geometría de un rectificador fmito típico p-n que se puede producir mediante procesos de aleación o difusión.

y

(región-p)

(13.3-6)

en donde

(13.3-7)

y

(13.3-8)

mientras que la ecuación de la corriente es ¡ =

I~(eeVo/kT _

1)

(13.3-9)

(npoD. r

+ P.oDp r) L ~• .

(13.3-10)



p

y

/' -

o- e

~P

L

454

Rectificadores de unión p-n y transistores

La característica de corriente y voltaje obtenida de esta manera tiene la misma forma que la que se derivó para el dispositivo infmito, excepto que la corriente de saturación está modificada por los factores ~P y ~n, que comprenden las longitudes de difusión, las velocidades de recombinación y los espesores de las capas volumétricas. Si sn =Dp/Lp, se observará que ~n = 1 y (13.3-5) se reduce a (13.1-20). La región n del dispositivo termina con una superficie cuya velocidad de recombinación es igual a esta velocidad característica de difusión Dp/Lp; esto hace que la distribución de portadores de carga sea exactamente la misma que si esta región del dispositivo tuvier.a una extensión infinita. Si además sp = Dp/Lp, entonces (13.3-6) se reduce en la misma forma a (13.1-19) y (13.3-11)

ló = 10

en donde / 0 es la corriente de saturación del diodo infinito, tal y como está dada en (13.1-24). Si sn >Dp/Lp y sp >Dn/Ln, entonces, ~n y ~P tendrán valores mayores que la unidad, y la corriente de saturación sobrepasará a la del dispositivo infmito: si Sn
(13.3-12)

en tanto que, si sn y Sp son grandes en comparación con las velocidades características de difusión respectivas, la corriente de saturación se convierte en

Los contactos extremos metálicos y "óhmicos" de área grande que se utilizan con frecuencia como terminales extremas, como se ilustra en la figura 13.6(b), se comportan casi siempre en la misma forma que las superficies con una velocidad de recombinación extremadamente alta. Es razonable esperar este comportamiento desde un punto de vista físico, ya que un contacto que es eléctricamente óhmico no inyectará corrientes de portadores en exceso. En efecto, debe actuar de tal manera que mantenga la concentración de portadores en equilibrio en la región adyacente del semiconductor. Sin embargo, así se comporta una superficie con una velocidad de recombinación muy alta, de acuerdo con la ecuación (10.5-14). Por tanto, la ecuación (13.3-13) puede aplicarse a la estructura del rectificador que aparece en la figura 13 .6(b ). Al incrementar el voltaje de polarización inversa en este tipo de dispositivos, las capas de carga espacial aúyacentes a las uniones se extienden más y más dentro de las regiones volumétricas p y n. Entonces, las distanciasdp- x 0 _ y dn- x 0 + varían con el voltaje de acuerdo con (12.4-21) y (12.4-22), y se observa que la corriente de saturación (13.3-10) depende en parte del voltaje aplicado al igual que de los otros parámetros que aparecen ahí. Cuando dn y dp son grandes en comparación con el valor más alto que x 0 + o x 0 _ pueden tener antes de llegar a la condición de ruptura, esta variación de la corriente de saturación con el voltaje de polarización es insignificante; pero si x 0 + o x 0 _ llegan al orden de dn o dp a un voltaje aplicado que pueda lograrse en la práctica, entonces el efecto puede ser muy importante. Si la velocidad de recombinación en la terminal extrema es muy alta,

Rectificadores de unión de tamaño finito

455

entonces, de acuerdo con (13.3-13), la corriente de saturación puede hacerse extremadamente grande conforme la región de carga espacial tiende hacia el contacto extremo, ya que lím ctnh x = uo. Por tanto, se observa un efecto algo similar a la x-+0

ruptura, aunque (como se verá más tarde) las causas físicas de la verdadera ruptura se basan en las propiedades físicas volumétricas del semiconductor, en tanto que el efecto antes citado, que se denomina perforación, depende en forma crítica de las dimensiones del dispositivo. Se puede lograr una comprensión física de la perforación recordando que la corriente de saturación de un rectificador p-n es la corriente que se origina debido a la recolección de portadores minoritarios térmicamente generados que efectúa la unión con polarización inversa. Sin embargo, de acuerdo con (10.5-6), el flujo de equilibrio de los portadores térmicamente generados producido en una superficie con una alta velocidad de recombinación, es muy grande. De donde, si el borde de la región de carga espacial de la unión se acerca a una superficie con una alta velocidad de recombinación (o un contacto metálico óhmico que se comporta de un modo muy semejante), la corriente inversa se incrementa enormemente debido a este flujo superficial de generación térmica. Si la capa de carga espacial está separada de la superficie o del contacto por una región volumétrica de espesor apreciable, los portadores generados en la superficie deben difundirse a cierta distancia antes de ser recogidos; pero pueden recombinarse durante el tiempo que necesitan para difundirse hasta la unión. En estas condiciones, el flujo recogido por la unión puede ser mucho menor que el flujo inicial de generación superficial y, en consecuencia, la corriente inversa de la unión será más pequeña. Si la región de carga espacial de la unión está a muchas longitudes de difusión de la superficie o del contacto, se puede hacer caso omiso del incremento en la corriente de saturación debido a la generación superficial. Por lo general, los efectos de perforación deben evitarse haciendo que las regiones p y n sean lo suficientemente gruesas para que la verdadera ruptura volumétrica se produzca antes de que las capas de carga espacial lleguen a los contactos extremos. Sin embargo, en algunas ocasiones se utiliza el efecto de perforación de manera intencional para obtener un dispositivo que tenga un incremento abrupto en la corriente de saturación, a un voltaje inverso específico, que se puede utilizar como un elemento regulador de voltaje. En la figura 13.7 se ilustra la característica de corriente y voltaje de un diodo de perforación de este tipo.

I

la corriente de saturación aumenta gradualmente con el voltaje de polarización inversa Perforación Figura 13. 7.

Relación corriente-voltaje de un rectificador p-n ilustra el efecto de "perforación".

de tamaño finito, en donde se

456 Rectificadores de unión p-n y transistores 13.4 MECANISMOS FISICOS DE RUPTURA EN LAS UNIONES p-n El fenómeno de perforación es un efecto semejante al de ruptura; pero su mecanismo se relaciona con las características estructurales del dispositivo más que con las propiedades físicas volumétricas del cristal. Sin embargo, existen dos mecanismos importantes por medio de los cuales se puede producir la verdadera ruptura de cristal y que son el mecanismo Zener6 y el mecanismo de avalancha. 7 La ruptura Zener se relaciona con el fenómeno de la emisión de campo, en la que los electrones se emiten desde un cátodo metálico frío mediante la creación de un campo extremadamente alto en la superficie del cátodo. El efecto se puede comprender basándose en la formación de un túnel de electrones en el nivel de Fermi del metal o cerca de éste, a través de una barrera de potencial superficial. como se ilustra en la figura 13.8. En esta figura, la superficie de un metal ideal de electrQnes libres aparece en (a), en ausencia de campos externos; la función de trabajo del metal es 1/Jo. Si se aplica un voltaje externo tal que el metal sea negativo con respecto a un electrodo externo, se tendrá un campo E entre los dos electrodos. que será constante en una geometría de plano paralelo. El potencial correspondiente tendrá la forma tjJ(?c) =-Ex+ const, como se ilustra en (b). Al incrementar la diferencia de potencial que se aplica externamente, la pendiente del potencial se hace cada vez mayor hasta que sólo existe una pequeña distancia entre los electrones cercanos al nivel de Fermi del metal y los estados permisibles de la misma ene(gía que está fuera del metal. En estas circunstancia:., los electrones libres del metal pueden formar un túnel a través de la delgada barrera de potencial superficial, creando una corriente de emisión de campo entre los dos electrodos. Se requieren campos externos muy elevados para producir corrientes de emisión de campo apreciables; con campos bajos, la barrera de potencial superficial es tan ancha que la probabilidad correspondiente de establecer un túnel es dt>spreciable. Debe hacerse notar que este es un efecto superficial primordialmente y que el campo dentro del metal es muy pequeño debido a la gran conductividad. En la práctica, en un aislador o semiconductor se pueden obtener campos eléctricos internos muy elevados. En tales condiciones, existen gradientes importantes dentro del cristal y la energía potencial de un electrón en la base de la banda de conducción, por ejemplo, es menor en un extremo del cristal que en el otro. Cuando las bandas de energía se grafican en la forma acostumbrada, en función de la distancia en la dirección del campo, tienen la inclinación que se indica en la figura 13.9. Si el campo aplicado y, por ende, la pendiente de las bandas, es lo suficientemente grande, sucederá que, entre los electrones situados en la parte superior de la banda de valencia y los estados desocupados de igual energía en la base de la banda de conducción, la barrera de energía potencial se hace muy angosta y se puede producir la formación de túnel en el interior del cristal, como se señala en la figura 13.9. En realidad, este efecto es una emisión de campo interno; el mecanismo antes descrito fue propuesto por Zener6 en 1934, para explicar el fenómeno de la ruptura eléctrica volumétrica o semiconductores. En cristales uniformes de silicio o germanio (excepto a temperaturas muy bajas cuando los portadores provenientes de los donadores y receptores se "congelan"), es imposible obtener campos eléctricos lo suficientemente altos para observar una ruptura volumétrica Zener sin que el cristal se funda debido a un calentamiento óhmico. Sin embargo, en una muestra que contiene una unión p-n, existe un campo 6 7

C. Zener, Proc. Roy. Soc. (Londres), 145, 523 (1934). K. G. McKay y K. B. McAfee, Phys. Rev., 91 1079 (1953).

Mecanismos físicos de ruptura en los uniones p-n

-e4>(xl

~~~~·' ~ ~Electrones ~libres

~

Túnel de electrones a través de una barrera delgada

t E>O

E•O

Vacío

Metal

E

Vacío

Metal

Metal

grande

Vacío (e)

(b)

(a) Figura 13.8.

457

Diagrama de potencial cercano a la superficie de un metal, en donde se muestran las etapas sucesivas conforme se incrementa gradualmente un voltaje aplicado desde fuera. En (e) se produce la emisión de campo y los electrones del interior del metal forman un túnel a través de la delgada barrera superficial.

eléctrico inherente en la umon, y la magnitud de dicho campo puede incrementarse de gran manera aplicando al dispositivo un voltaje de polarización inversa, como se ilustra en la figura 13.10. Es evidente que la inclinación de las bandas de energía en la unión p-n con polarización inversa da origen a una situación (análoga a la que se presenta en la figura 13.9(c) para una muestra volumétrica), en que la formación de túnel puede producirse cuando la barrera de potencial que separa a los electrones en la parte superior de la banda de valencia de los estados desocupados de la banda de conducción de igual energía se hace lo suficientemente delgada. Generalmente, esta condició11 se obtiene sólo mediante la aplicación de una polarización inversa a la unión; pero se obtiene con mayor facilidad en las uniones abruptas p-n, en donde la caída total de potencial se confina a una distancia mínima y en estructuras Cle Barrera de potencial que separa al electrón en A del estado vacío de conducción de igual energía en ·~------..---

B-----...: 1

1

e:..

··w,aÉÍ~~tr'o'~is~A

1 1

~,..~ ",..

",.. ~,..

",..B

E=O

-x

(a) Figura 13.9.

(b)

(e)

Diagrama de potencial de un semiconductor volumétrico uniforme que presenta las etapas sucesivas conforme se incrementa en forma gradual un voltaje aplicado externamente. (e) La emisión interna de campo se produce y los electrones for· man un túnel a través de la delgada barrera de potencial, desde la banda de valencia hasta la de conducción.

458

Rectificadores de unión p-n y transistores

··n:_ ti po-n

!l.

(a) Polarización cero

(b) Alta polarización inversa

Figura 13.10.

Diagrama de potencial de una unión p-n (a) con polarización cero, (b) con una alta polarización inversa. En (b) se produce la ruptura Zener, cuando los electrones establecen un túnel a través de la delgada barrera, desde la banda de valencia a la de conducción.

unión en donde tanto la región p como la n tienen una fuerte impurificación, dando también como resultado (de acuerdo con la ecuación (12.4-24) y las cifras de la tabla 12.1) regiones de carga espacial de la unión que son muy angostas, en donde existen campos elevados internos incluso a un voltaje aplicado de cero. En el mecanismo de avalancha, la ruptura de la unión se produce cuando los electrones y los huecos adquieren la suficiente energía entre colisiones, proveniente de un campo eléctrico elevado, en la región espacial de la unión, para crear pares electrón-hueco, debido a la ionización por impacto de los enlaces covalentes de red. Este efecto es similar a la ionización de avalancha Townsend para un gas, en donde los electrones dentro de un medio gaseoso adquieren la suficiente energía, entre colisiones, a partir de un campo aplicado para ionizar los átomos con los que chocan. Los electrones y los huecos que se crean de esta manera, pueden a su vez. adquirir la suficiente energía del campo para crear otros pares por ionización de impacto, iniciando una reacción en cadena que lleva a corrientes inversas muy elevadas. Para que se. produzca una avalancha, un electrón o un hueco debe adquirir la suficiente energía del campo al recorrer una distancia del orden de la trayectoria libre media para crear un par electrón·hueco. Entonces, se llega a la condición para una ruptura de avalancha cuando el campo en la región de la unión alcanza un valor crítico Eb tal que

o bien, (13.4-1)

Mecanismos físicos de ruptura en las uniones p-n

459

En el germanio y el silicio, la trayectoria libre media a la temperatura ambiente es del orden de 10- 5 cm y, por tanto, puede esperarse que la ruptura de avalancha se produzca sólo cuando la intensidad del campo en la región de la unión exceda de aproximadamente 100 kV/cm. De igual manera, puesto que en todos los cristales excepto los muy impuros, la trayectoria libre media se determina por las interacciones con fonones y, dado que al aumentar la temperatura se incrementa también el número de fonones disponibles, la trayectoria libre media por la dispersión con fonones disminuye, al aumentar la temperatura. En consecuencia, el campo y el voltaje en la ruptura por avalancha aumentan (aunque con mucha lentitud) al incrementarse la temperatura. Esto contrasta notablemente con el campo de ruptura Zener que es prácticamente independiente de la temperatura, ya que sólo depende de la banda de energía prohibida y el espesor de la barrera de túnel. El voltaje real de la ruptura de avalancha para una unión abrupta se puede obtener en forma aproximada observando, de acuerdo con (13.4-I) y (12.4-24) que si Vb es el voltaje de ruptura y si Vb ~ r/> 0 , se puede escribir

( 13.4-2) de donde,

vb

está dado por

vb =

K(Llc)z

(__!_ +

8n:e 3 A2 Nd

_!_). Na

( 13.4-3)

También en este caso se observa que las densidades de impurificación relativamente leves producen voltajes de ruptura elevados y viceversa. Así también, se prefiere usar materiales con grandes bandas de energía prohibida para dispositivos que deben resistir ur.a ruptura de avalancha a altos voltajes inversos. El tipo de ruptura que se produce en un dispositivo dado depende en gran parte del material y los parámetros estructurales del dispositivo, así como de las condiciones en las que opera. En general, los dispositivos con uniones muy abruptas y con densidades de impurificación muy grandes a ambos lados de la unión, sufren la ruptura por el mecanismo Zener, en tanto que los dispositivos con uniones graduales o con uniones abruptas, en las que una de las regiones posee sólo una impurificación moderada, el mecanismo de avalancha es el dominante. En algunas ocasiones, dispositivos que presentan la ruptura de Zener a la temperatura ambiente, sufren también una ruptura de avalancha cuando operan a temperaturas mucho más bajas, debido al incremento en la trayectoria libre media. Muss y Greene 8 descubrieron que las uniones abruptas p-n en el germanio en donde la concentración de impurificación de la región p es muy alta (aproximadamente 10 18 cm- 3 ), presentan a la temperatura ambiente una ruptura Zener, cuando la concentración de donadores Nd en el lado n es mayor que alrededor de 3 X 10 15 cm- 3 , los dos mecanismos en forma simultánea para 3x 10 15 cm- 3 >Nd>7.5x 10 14 cm- 3 , y la ruptura de avalancha para Nd < 7.5 x 10 14 cm- 3 . Si las uniones p-n de semiconductores se diseñan y fabrican debidamente, se pueden obtener características de ruptura muy nítidas, haciéndose con precisión y en forma reproducible a un voltaje dado, que puede ser insensible a la temperatura. Estos dispositivos se pueden emplear como diodos de voltaje de referencia y las unidades diseñadas con este fin en particular se denominan "diodos Zener", aunque a pesar de la nomenclatura, el mecanismo de ruptura que utilizan es a menudo el efecto de avalancha. 8

D. R. Muss y R. F. Greene, J. Appl. Phys., 29, 1534 (1958).

460 13.5

Rectificadores de unión p-n y transistores

TECNICAS DE FABRICACION DE LA UNION p-n

En esta secc10n se revisarán brevemente los aspectos tecnológicos más importantes de la fabricación real de la unión p-n. Este estudio se limitará en gran parte a los aspectos cualitativos del tema, ya que para analizar rigurosa y cuantitativamente los problemas que se presentan necesitaríamos introducir conceptos de fisicoquímica y metalurgia que quedan fuera del alcance de esta obra. No obstante, se espera que este análisis proporcione al lector conocimientos suficientes sobre los principios físicos necesarios. Desde el punto de vista experimental existen tres formas principales de preparar dispositivos de unión p-n; el método de crecimiento de unión, el de aleación y el de difusión. En el método de crecimiento de unión, se hace crecer un cristal semiconductor, por ejemplo, a partir de un fundido que inicialmente es de tipo n y que, mientras el cristal se está formando, se vuelve a impurificar agregando las suficientes impurezas receptoras de tal manera que la porción del cristal que crece posteriormente sea tipo p. La unión resultante es más bien de tipo gradual que absoluto. Aunque se puede observar un control preciso de las concentraciones de impureza a ambos lados de la unión por este método, la dificultad para localizar la unión en el cristal crecido y el problema que representa unir conductores a las regiones angostas de la unión crecida, han impedido que se generalice esta técnica de elaboración. Sin embargo, tiene cierta importancia histórica ya que los dispositivos de unión p-n se prepararon originalmente mediante este proceso. En el método de aleación se usa un pequeño trozo u hoja de material para la aleación, que se fusiona sobre el cristal base del semiconductor. El trozo de material contiene las impurezas que darán origen al tipo de conductividad opuesto al del cristal original; una vez que se ha fundido, se eleva la temperatura a un valor lo suficientemente alto para permitir que el material fundido disuelva hasta cierto punto el cristal semiconductor subyacente, como se indica en la figura 13.1l(b). La fase líquida es, entonces, una solución del material semiconductor dentro de la aleación líquida que se satura más o menos a la temperatura máxima de fabricación. Puesto que la solubilidad de equilibrio del semiconductor en el metal líquido aumenta normalmente con la temperatura, cuando el dispositivo se enfría con lentitud, la

Trozo de indio

cSb' (o)

In + Ge disuelto

~~~

In + Ge disuelto a 200"C

Unión T=

soo•c

(b)

T

= 200"C (e)

Aleación de In solidificada

T = 20"C

(d)

Figura 13.11.

Etapas sucesivas de la fabricación de un rectificador p-n de aleación.

Técnicas de fabricación de la unión p-n

461

solución se supersatura con respecto al soluto y algunos átomos de semiconductor disuelto se recristalizan en la interfaz líquido-sólido continuando la estructura de un solo cristal de substrato. Puesto que la fase líquida contiene las impurezas asociadas con el tipo de conductividad opuesto al del cristal original, el material recrecido tendrá una conductividad opuesta y se produce una unión p-n en la interfaz del material original y el recrecido. Con un enfriamiento subsecuente, toda la fase de aleación se solidifica y, entonces, el problema de establecer las conexiones eléctricas en el cristal original y en el trozo de aleación resolidificado, es cuestión sencilla. Este proceso se ilustra esquemáticamente en la figura 13.11. En la práctica, las uniones p-n se pueden fabricar con facilidad utilizando germanio tipo n como material base e indio puro (punto de fusión 156°C) como agente de aleación. En este caso, la capa recristalizada estará saturada de indio haciendo que esta región sea tipo p y, a decir verdad, de un fuerte tipo p. Si el material de base es germanio tipo n con un contenido moderado de impureza, el dispositivo es fuertemente asimétrico y la región p tiene una impurificación mucho más marcada que la n. Se pueden obtener concentraciones de impureza mucho más altas en la región p incorporando una pequeña cantidad de galio al indio, ya que la solubilidad en equilibrio en fase sólida del galio en el germanio es mayor que la del indio. 9 Las capas n recristalizadas se pueden formar sobre cristales de germanio tipo p de un modo similar, utilizando hojuelas o trozos de aleaciones de plomo y antimonio, o estaño y antimonio. En cristales de silicio, las uniones por aleación se pueden lograr utilizando hojuelas o trozos de aluminio u oro-antimonio. Los procesos de aleación proporcionan casi siempre uniones muy abruptas. Esto es muy apropiado para los requisitos de fabricación; en particular, es muy sencillo hacer simultáneamente dos uniones a ambos lados de un cristal delgado, formando así una estructura de transistores p-n-p o n-p-n al que se pueden sujetar con suma facilidad los cables de emisor, base y colector (véase la figura 13.12). Aunque a veces es dificil ejercer un control dimensional estricto en dispositivos fabricados por el p1 oceso de aleación, la facilidad y simplicidad de la técnica ha hecho que se utilice profusamente como método de producción para muchos tipos diferentes de dispositivos. En el método de difusión, se utiliza un elemento de impureza que se difunde a una temperatura elevada dentro de un cristal cuya conductividad es opuesta a la que se produce debido a la presencia de la impureza de difusión en la red cristalina. La profundidad de la unión localizada por debajo de la superficie del cristal y el gradiente de concentración de impureza en la unión se puede controlar regulando el tiempo de difusión y la temperatura, así como la concentración superficial de la impureza de difusión. Si c(x,t) es la concentración de la impureza de difusión a una

Figura 13.12.

Diagrama de la sección transversal de un transistor p-n-p de aleación.

9 Es relativamente sencillo calcular las verdaderas concentraciones de impurezas de la región p obtenidas, por medio de los diagramas de fase en equilibrio. Al final del capítulo hay un ejercicio sobre este tema.

462

Rectificadores de unión p-n y transistores

profundidad x por debajo de la superficie y después de un tiempo de difusión t, y si D es el coeficiente de difusión para la difusión de la impureza dentro del cristal,10 entonces c(x,t) se puede determinar como la solución de la ecuación de difusión (13.5-1)

En cuanto a las condiciones de frontera, se puede suponer que la concentracwn superficial c(O,t) es un valor constante dado c 0 para todos los valores de t, de donde, (13.5-2) c(O,t) = c0 = const, y también que

lim c(x,t) = O.

(13.5-3)

La solución que satisface estas condiciones de frontera es

c(x,t) = c0

erfc(J~Dt)

(13.5-4)

en donde erfc cxx = l - erf cxx = 1 -

2cx fx J1r. e-~ x

2 •2

0

dx'.

(13.5-5)

El perfil de concentración después de cualquier tiempo de difusión dado se puede calcular a partir de (13.5-5). La unión p-n se encontrará en el punto en donde c(x,t), que es la concentración de impurezas de difusión según lo establece (13.5-5), es igual a la densidad de impurezas que estaban presentes originalmente en el cristal. En la figura 13.13 se presenta una familia típica de perfiles de concene (x,t)

' Posición de la umon correspondiente a distintos tiempos de difusión Figura 13.13.

Representación esquemática del perfil de concentración de impurezas dentro de un rectificador difundido, a diferentes tiempos de difusión.

10 El coeficiente de difusión D que se usa aquí no debe confundrrse con los coeficientes de difusión Dn y Dp para electrones y ruccos. El coeficiente de difusión que aquí se estudia es el que se relaciona con la difusión de impurezas de substitución en la red mediante un mecanismo de vacantes que se vio en el capítulo 11, y es mucho más pequeño que Dn y Dp: Los valores típicos de las impurezas comunes de substitución en el Ge están dentro del rango de 10 -12 - 10 -13 cm2fseg a temperaturas de 800°C.

Transistores de unión p-n-p y n-p-n

463

tración, según lo que establece la ecuación anterior, para varios valores distintos de tiempo de difusión. En esta figura se indican también las posiciones sucesivas de la unión para cada valor de tiempo de difusión. Las uniones fabricadas por difusión pueden ser graduales o muy abruptas, dependiendo del tiempo de difusión, la concentración superficial y la densidad de impurezas en el cristal original. Aunque la adición de los cables a las capas difundidas presenta ciertos problemas técnicos, la facilidad y precisión con que se puede controlar el espesor de las capas difundidas ha conducido al uso generalizado de la difusión como técnica de fabricación. En la figura 13.14 se ilustran las etapas de la producción de un transistor difundido p-n-p. Material rebajado mediante el ataque

p- Ge

J

c----P----:) l"fmfco ~ (bl

(O)

~

n p

n

(el

:~

(d) Figura 13.14.

13.6

Etapas sucesivas de Ia fabricación de un transistor n·p-n por difusión.

TRANSISTORES DE UNION p-n-p Y n-p-n

Una estructura semiconductora que tiene un electrodo de emisor para inyectar portadores minoritarios excedentes al cristal semiconductor y un electrodo colector para recuperarlos, se conoce con el nombre de transistor y se puede fabricar para que amplifique corrientes o señales de voltaje, se use como oscilador o dispositivo de conmutación. Los electrodos de emisor y colector pueden ser puntas de contacto o uniones p-n. El transistor original, tal como lo inventaron Shockley, Bardeen y Brattain (1948), tenía puntas de contacto para el emisor y el colector; pero estos dispositivos han sido superados por completo en el mercado comercial por los transistores de unión p-n, que fueran inventados por Shockley (1950). En realidad el aparato de Haynes-Shockley para medir la movilidad de los portadores inyectados es un transistor y se puede emplear de un modo muy conveniente para entender los principios del funcionamiento del transistor. En la figura 13.15 se muestra un diagrama simplificado de este dispositivo. Supóngase que se hace fluir una corriente uniforme de emisor le en sentido directo desde el electrodo emisor de este diagrama, por medio de un voltaje de polarización directa Ve. Se inyectan huecos al cristal semiconductor (que en este caso se supone tipo n) que se desplazan hacia el electrodo colector y son recogidos ahí por medio del colector con polarización inversa, haciendo que fluya una corriente de colector le a través del circuito de colector y una resistencia de carga a tierra.

464

Rectificadores de unión p-n y transistores

Figura 13.15.

Diagrama esquemático de un transistor de puntas de contacto y su circuito externo. La batería de barrido conectada a la base del dispositivo no' se necesita para la operación del transistor; pero se incluye en este diagrama simplemente para demostrar la relación de la estructura con la del transistor de filamentos de Haynes-Shockley del capítulo lO.

El voltaje de emisor Ve requerido para hacer que fluya la corriente en el circuito de emisor, puede ser mucho más pequeño que el voltaje inverso Ve que se aplica al colector. Así si casi todos lo huecos emitidos llegan al electrodo colector, 11 la corriente de colector será casi igual a la de emisor. Por tanto, es obvio que un pequeño cambio en la corriente de emisor, producido por una pequeña entrada de potencia en el emisor, puede originar casi el mismo cambio en la corriente de colee· tor que fluye a través de un circuito de una impedancia mucho mayor en el que se mantienen voltajes más elevados, y producir un cambio grande en la potencia que pasa a la resistencia de carga. Esto se puede demostrar de un modo más cuantitativo expresando la corriente de emisor en función del voltaje de emisor mediante la ecuación 12

(13.6-l) en donde leo es la corriente de saturación del emisor. Del mismo modo, se puede escribir la siguiente relación de corriente-voltaje en el colector (13.6-2) en donde leo es la corriente de saturación, asociada con el colector y a representa la fracción de la corriente de emisor que se recupera subsecuentemente como corriente de portadores minoritarios en el colector. En esta ecuación, el primer término representa la componente de la corriente de colector debida a la recuperación normal de portadores minoritarios que se generan térmicamente dentro del cristal semi-

11 En el experimento Haynes-Shockley, si el objetivo es medir con precisión las concentraciones de los portadores en exceso y los tiempos de arrastre, la fracción de portadores minoritarios que recoge el colector se mantiene baja intencionalmente para no modificar las caraterísticas de difusión del sistema que se investiga. No obstante, en cualquiera de estos sistemas que se·usa como transistor, el propósito es recoger una fracción de portadores minoritarios inyectados tan grande como sea posible para aumentar al máximo el factor de amplificación asociado con el dispositivo. 12 Se ha establecido claramente que una relación corriente-voltaje de esta forma es la que debe esperarse de una unión p-n en el emisor. Sin embargo, en un capítulo posterior se verá que puede esperarse una relación de la misma forma en un rectificador de puntas de contacto. Se puede llegar a conclusiones similares en conexión con la relación corriente-voltaje del electrodo colector.

Transistores de unión p-n-p y n-p-n

46S

conductor, mediante el electrodo colector con polarización inversa, en tanto que la segunda representa la componente adicional creada por los portadores minoritarios inyectados en el emisor y que después recoge el colector. En un transistor bien diseñado, el factor a es muy cercano a la unidad; pero no puede ser igual por completo ni superarla, debido a que parte de los portadores minoritarios inyectados por el emisor no podrán llegar al colector a causa de la recombinación en la parte volumétrica del cristal semiconductor o en la superficie de éste. En el funcionamiento normal del transistor, la corriente de emisor se mantiene a un valor mucho mayor que leo y el colector tiene una polarización inversa profunda dentro de la región de saturación; en estas condiciones, las ecuaciones (13.6-1) y (13.6-2) pueden escribirse más o menos como sigue (13.6-3) y

(JVcl

~

(13.6-4)

kT/e).

La ecuación (13.6-3) se puede expresar como sigue kT 1, V,=-ln-,

(13.6-5)

1,0

e

y, de acuerdo con esto, es evidente que una pequeña vanac10n de la corriente de emisor die ~e relaciona con una variación dVe en el voltaje de emisor de acuerdo con dV '

= kT di, e

(13.6-6)

l, ·

El cambio correspondiente en la potencia de entrada en el circuito del emisor está dado por

dP, = d(l,V.) = I, dV,

+

V, di,= kT (1

e

+ ln ~)di,. 1,0

(13.6-7)

Sin embargo, en el circuito de salida o colector se tiene que, de acuerdo con (13.64),

(13.6-8) y, puesto que la potencia entregada a la resistencia de carga es P1 = I'f:R 1, se tiene que (13.6-9) en donde le y die se han relacionado con le y die por medio de (13.64) y (13.6-8 ). No obstante, si a eo:: 1 y le~ leo, como sucede casi siempre, el primer término de (13.6-9) es mucho más pequeño que el segundo y, por ende, puede desecharse, de donde, la ecuación se reduce a ( 13.6-101

466 Rectificadores de unión p-n y transistores Si die se expresa en función de la potencia de entrada dPe por medio de (13.6-7), la razón de la potencia de salida a la de entrada se expresa como

dP1 2cx 2 I,R 1 dP. = kT ( 1+ n e 1,0

l I.) .

(13.6-11)

Esta ecuac10n expresa la ganancia de potencia en c-d con señal pequeña del dispositivo. En un caso típico, se podría esperar que los valores de los diferentes parámetros fueran más o menos como sigue: le= 10 maleo= 10 /.lfl, a= 0.99,R 1 = 1000 ohms y kT/e =1/40V a 300°K. Si se substituyen estos valores en la ecuación anterior, se obtiene una ganancia de potencia de aproximadamente 100. La ganancia de corriente del dispositivo es la relación dlc/dle. De acuerdo con (13.6-8), es obvio que esta cantidad es sencillamente a y que, en general, de acuerdo con (13.6-2), la ganancia de corriente puede representarse como

(ole)

(13.6-12)

ex- -

- oJ,

Ve

'---.-b.---' Contacto

b

óhmico de base

( b)

(o)

(e)

Figura 13.16.

c::=J tipo·n

~tipo-p

(d)

Etapas sucesiva• de la "transformación topológica" del transistor de filamentos de Haynes-ShocÍdey mencionado en el capítulo 10 para convertirlo en una estructu· ra p-n·p planar convencional.

En la figura 13.16(a) se ilustra la estructura de Haynes-Shockley (sin circuito de barrido, que no se requiere en un transistor en donde se confía sólo en la difusión para transportar los portadores en exceso del emisor al colector), que se puede convertir a un transistor convencional de unión p-n-p mediante una "transformación topológica" que altera las dimensiones y las proporciones de las diferentes partes del dispositivo, pero dejan inmutables sus relaciones físicas y básicas. Esto se logra tal como se ilustra en la figura 13.16. Los electrodos de puntas para el contacto del emisor

Transistores de unión p-n-p y n-p-n

467

y el colector se substituyen primeramente usando en su lugar dos regiones pequeñas tipo p bajo los cables de conexión que ahora se consideran como contactos óhmicos a las regiones p, como se indica en la figura 13.16(b). Es evidente que esto no afecta el funcionamiento del dispositivo, ya que las características de corriente-voltaje de los puntos de contacto de rectificación y las uniones p-n son fundamentalmente lo mismo. A continuación, se considera que las regiones p se extienden como sucede en (e) para incluir un volumen mayor del cristal, llegando por último a la configuración convencional del transistor de unión p-n-p que aparece en (d). Aunque el aspecto de esta estructura es diferente al del transistor de filamentos de Haynes-Shockley, funciona más o menos en la misma forma. La razón por la que se adopta la estructura ilustrada en (d) de la figura 13.16, es que la fracción de huecos inyectados en el emisor, que sobreviven para poderse recoger en el colector (y, con el! o, obtener la ganancia de corriente del dispositivo) debe hacerse tan grande como sea posible. La ganancia de corriente a puede diferir de la unidad debido a la recombinación de portadores en exceso en la región de base del transistor; también puede diferir de la unidad porque no toda la corriente de unión del emisor se debe a la inyección de huecos en la región de base tipo n proveniente del emisor tipo p. Existe también una componente de la corriente de emisor que se origina por la inyección de electrones desde la región de la base hacia el emisor, que no produce ninguna corriente de señal en el colector; pero que fluye a través del conductor de base. Esto equivale a decir que la eficiencia de inyección de huecos de la unión 11p, como se vio en la sección 13.1, no llega por completo a la unidad, y que la eficiencia de inyección de electrones 11n no es cero. Por esta razón, se ve claramente la ventaja de diseñar el transistor p-n-p de tal manera que la eficiencia de inyección de huecos de la unión de emisor sea casi la unidad y la eficiencia de inyección de electrones sea muy reducida. En cualquier caso, la ganancia de corriente a se puede expresar como el producto de la eficiencia de inyección de portadores minoritarios del emisor por la fracción de los portadores minoritarios que, una vez que se han inyectado dentro de la región de base del dispositivo, sobreviven para ser recogidos por el colector 13 por lo cual, si este último factor se representa por medio de f, (13.6-13) La ganancia de corriente de un transistor planar p-n-p, como el que se presenta en la figura 13.17, se puede calcular con los métodos de análisis que se desarrollaron en la sección 13.1 en relación con el rectificador de unión p-n. Las ecuaciones de continuidad de estado estacionario se puede expresar como sigue

Pn- Pno_ O 2

LP

-

(x
(13.6-13)

>O; región de la base)

(13.6-14)

(x

13 Además, existe una posibilidad de que la eficiencia del colector no sea la unidad, por que parte de la corriente de colector se deberá a la emisión de portadores minoritarios que va desde la región del colector hacia la región de la base. No obstante, en las condiciones normales de polarización de colector, este efecto es tan pequeño que puede desecharse, en comparación con los dos efectos antes vistos. Por tanto, aquí sólo se toma cuenta explÍcita de los dos efectos mayores.

468

Rectificodores de unión p-n y transistores

Por tanto, esto hace suponer que todas las caídas de voltaje aparecen en las uniones y, en consecuencia, no existen campos en las regiones volumétricas y, también, que las densidades de portadores inyectados son pequeñas en todas partes en comparación con las cantidades de portadores mayoritarios en equilibrio. También se supondrá que el efecto de la generación y recombinación de portadores dentro de las regiones de carga espacial asociadas con las uniones, son despreciables y que la extensión de tales regiones es pequeña en comparación con el espesor de la región de base. En estas circunstancias, lo único que se requiere es aplicar condiciones de

Base (tipo-n)

Emisor (tipo·P.)

Colector (tipo-p)

Unión del colector X=d

x=O

Figura 13.17.

-X

Geometría y notación utilizadas en el análisis del transistor planar p-n-p de la sección 13.6.

frontera y evaluar las corrientes de difusión en x =O y x = d, evitando las complicaciones que introducen las cantidades x 0 + y x 0 _ en las ecuaciones de la sección 13.1. Evidentemente, y realizando sólo un esfuerzo un poco mayor en los cálculos, cualquier efecto producido por la extensión fmita de las capas de carga espacial se puede resolver por los métodos usados en las secciones 13.1 y 13.3. En lo que respecta a condiciones de frontera, será necesario que (13.6-15)

(es decir, que cualquier densidad de portadores minoritarios en exceso desciende a cero muy lejos, dentro de la región del emisor), que Pn(d) =O,

(13.6-16)

por lo cual, la densidad de portadores minoritarios excedentes se reduce a cero en el borde de la unión de colector con polarización inversa (esto se deduce de la aplicación de la condición de frontera (13.1-13) en la unión de colector con un voltaje de colector grande y negativo) y, además, que en la unión del emisor n P(O)

= n pO eev ,/kT

(13.6-17) (13.6-18)

Las condiciones de frontera en la unión del emisor corresponden totalmente con las que se estudiaron en el caso del rectificador p-n. Por supuesto, se supone

Transistores de unión p-n-p y n-p-n

469

que la región del emisor se extiende a muchas longitudes de difusión a la izquierda de la unión de emisor. La solución general de estas ecuaciones se puede expresar en la forma que sigue

n p - n p o = AexfLn + Be-xfLn

(x
(13.6-19)

y X

X

Pn - Pno = C cosh - + D senhLP LP

(x > 0).

(13.6-20)

De acuerdo con (13.6-15), se ve que B =O; en este caso, las condiciones de frontera para electrones y huecos en la unión del emisor están dadas por

(13.6-21) y

(13.6-22) Ahora se puede utilizar la condición de frontera de colector (13.6-16) para evaluar el único coeficiente restante, y el resultado es

.!!..],

D = - Pno[(eeY,/kT- 1) ctnh .!!._ + csch LP LP

(13.6-23)

por lo cual, de acuerdo con (13.6-19) y (13.6-20)

np _ npO = npO(eeV.JkT _ l)ex/Ln Pn- Pno

= Pno[(eeV,fkT-

1) cosh

(13.6-24)

~- {<eeV.JkT- 1) ctnh .!!._ + csch .!!...} senh ~] LP

LP

LP

LP

(13.6-25) Las corrientes de electrones y huecos que pasan por las uniones de emisor se evalúan como se hizo en el caso del rectificador p-n, lo cual da

Jn(O) = -Dn(dnp) = - npoDn (eeV.JkT- 1) dx o Ln

(13.6-26)

y

(13.6-27) La densidad de corriente de huecos que pasa por el colector se determina en la misma forma y el resultado es

470 Rectificadores de unión p-n y transistores La eficiencia de inyección de huecos en la unión de emisor es la razón entre la corriente de huecos y la corriente total que pasa por el emisor. Esto se calcula a partir de (13.6-26) y (13.6-27). Cuando se hace esto se puede suponer que en la operación normal del emisor, la corriente real de emisor es mucho mayor que la de saturación, de tal manera que ee V efkT > l. Los términos de las ecuaciones anteriores que no contienen el factor exponencial se pueden hacer a un lado y (recordando que nnoPno = Pponpo = n~ ), se puede demostrar fácilmente que

(13.6-29)

La fracción de huecos inyectados en el emisor, que sobreviven a la recombina· ción para ser recogidos en el colector, en estado estacionario, es d d d ctnh - cosh - - senh~ LP LP LP = h.:!._ . f = Jp(d) d sec O) _ Jp( LP ctn h LP

(13.6-30)

También en este caso se ha hecho caso omiso de los términos de (13.6-27) y (13.6-28) que no contienen el factor exponencial eeVefkT. Ahora, la ganancia de corriente a se puede expresar como (13.6-31)

Este resultado se obtuvo suponiendo que Ve> kT/e; pero se puede demostrar, usando un método de cálculo más preciso, que (13.6-31) es correcta, ya sea que se satisfaga o no esta condición. Los detalles de esta proposición están asignados en el ejercicio 13.6 al final de este capítulo. Es evidente que, para que a sea tan grande como sea posible, es necesario que la anchura de la región de base tenga un mínimo posible, y que la longitud de difusión Lp (y, por ende, el tiempo de vida de los huecos dentro de la región de base tipo n) sea también lo más grande posible; además, para proporcionar la máxima eficiencia de inyección de huecos, la densidad de impurificación del emisor Ppo debe ser mucho mayor que la densidad de impu· reza nno en la región de base del dispositivo. Esta última condición se satisface automáticamente, cuando los transistores de germanio p-n-p se fabrican por el proceso de aleación, utilizando trocitos de indio para formar las regiones de emisor y colector recristalizadas y germanio tipo n para moderar la densidad de impurezas de la base. De acuerdo con las suposiciones que se hicieron en estos cálculos, se encuentra que la ganancia de corriente es independiente de la corriente de emisor. Para valores muy grandes de ésta, la densidad de portadores en exceso en la región de la base. cerca del emisor, puede ser igual o sobrepasar a la densidad de portadores mayoritarios en equilibrio en ese punto. Cuando esto sucede, ya no se puede utilizar la forma simple de las condiciones de frontera en la unión, tal como lo indican (13.1-12) y (13.1-13), y es necesario adoptar la forma más general (que se describe en la nota al calce 1 de la sección 13.1). Entonces, se puede demostrar que la eficiencia de inyección de huecos de la unión de emisor desciende por debajo del valor dado por (13.6-29), existiendo en la unión una corriente mayor de electrones

Transistores de unión p-n-p y n-p-n

4 71

que la que podría esperarse de acuerdo con la teoría de nivel bajo. Esta reducción en la eficiencia del emisor lleva a una reducción en la ganancia de corriente a grandes valores de corriente de emisor. La disminución en la eficiencia de emisión se sugiere de acuerdo con la forma de (13.6-29), en donde se obtiene una reducción en el valor de T/p para grandes corrientes de emisor, si la relación real (nn(O)/pp(O)) se usa en lugar de la relación de equilibrio nno/Ppo, siendo la relación verdadera mucho mayor que la relación de equilibrio en condiciones de una gran polarización directa, debido a que la condición de casi neutralidad requiere que cuando se inyectan grandes concentraciones de huecos en exceso en la región n, deben ir acompañadas de concentraciones equivalentes de electrones excedentes. El análisis anterior se ha concretado a la determinación de la ganancia de corriente en función de los parámetros del dispositivo en una condición de estado estacionario y, por ende, para una frecuencia cero. Para señales sinusoidales, se observa que la ganancia de corriente decrece al aumentar la frecuencia. La razón de este efecto se basa en la naturaleza del proceso de difusión. Si se aplica una señal sinusoidal al emisor de un transistor, en la región de base se genera una concentra· ción de densidad de portadores en exceso que varía de un modo también sinusoidal. En estas condiciones, los portadores se difunden saliendo de las regiones de alta concentración para "llenar" las de baja concentración, reduciendo la amplitud de la señal incluso si el tiempo de vida en la región de la base es infmito, como se ilustra en la figura 13.18. Cuanto más alta es la frecuencia, tanto más pronunciados son los P-P0

Frecuencia baja

f/,

. ¡A\~ In\~1ru1ru1nl111n\11ru1m\-/ ~!u~~fusión"'

U_l____

Alta frecuen-CI-a-+r_J_u_u_u_u_u_u_

+-

Figura 13.18.

----1 ' . . - - - - - - - - - - - - - - -

-x

Perfiles de exceso de portadores dentro de la región de base de un transistor p-n-p asociados con señales en c-a de alta y baja frecuencia, mostrando los efectos más drásticos de la difusión para atenuar las señales de alta frecuencia.

gradientes de concentración asociados con las variaciones locales en la densidad de portadores en exceso, y tanto más pronunciados los efectos de difusión. La variación de la ganancia de corriente en función de la frecuencia se puede entender cuantitativamente viendo la ecuación de continuidad dependiente del tiempo D C2 (P. - P.o) _ Pn - Pno P

cx

2

=

c(p. - P.o)

rp

iJt

(13.6-32)

Si se supone que p.(x,t)- Pno

= u(x)eiwr

(13.6-33)

y se substituye esto en (13.6-32), se obtiene la siguiente ecuación diferencial d2 u 1 -2- -(1 dx L 2p

+ iwr P )u(x) =0

(13.6-34)

472

Rectificadores de unión p-n y transistores

para u(x). La solución general de esta ecuación tiene la forma

u(x) =A exp(:P j1 + ianP) + B exp(- :P j1 + iw-rP)

= A exp

(p + iy)x LP

+ B exp

-(P

+ iy)x LP

,

(13.6-35)

en donde

p=

Re(j1 + iw-rp)

y

y

= Im(J 1 + iwtp).

(13.6-36)

El problema de calcular la parte real y la imaginaria que se mencionan en (13.6-36) se soluciona de un modo relativamente directo, y los resultados son (13.6-37) y (13.6-38) En las expresiones anteriores se debe escoger el signo más del radical, ya que en el límite, conforme w tiende a cero, se debe obtener (32 = 1 y '}' 2 =O. Si L~ representa la constante de decaimiento exponencial asociada con la solucion (13.6-25), entonces, al usar (13.6-37), es evidente que (13.6-39) siendo 1 J.: =

P

p

LP=

-J J- + 1

1

2LP

./1

+w

2 2 't" P'

(13.6-40)

en donde el valor de Lp es precisamente el valor de estado estacionario dado por (13.1-9). De acuerdo con (13.6-39) y (13.6-40), se ve que, a frecuencias bajas, la constante de degeneración L~ relacionada con la solución de la ecuación de continuidad está dada por

I.:P ~ LP

= jDPtP

(13.6-41)

que es precisamente el valor de estado estacionario que se obtuvo en (13.6-20), en tanto que para frecuencias crecientes, L~ disminuye a partir de este valor, acercándose en el límite de altas frecuencias al valor J.:

~ LPJWtp 2 = J2D W

P-

En la figura 13.19(a) se ilustra De acuerdo con esto, es efectiva de decaimiento que se entrada que llega al colector

P

(13.6-42)

una gráfica de L~ en función de la frecuencia. evidente que en las condiciones de c-a la distancia debe utilizar para encontrar la fracción de la señal de es L~ y no Lp. El valor L~(w) tal como lo da

Transistores de unión p-n-p y n-p-n 473 (13.640) debe substituirse en la ecuación (13.6-30), que proporciona el factor de decaimiento f. El resultado es d

sech-;--() ~p w a(w) = 'lp/ = b L d· nno p 1 +--tanhPpoLn LP

(13.6-43)

En condiciones normales, a la frecuencia cero, L~(O) será mucho mayor que la anchura de base d y f = sech (d/L~) será aproximadamente igual a la unidad. Al aumentar la frecuencia, se llegará a un punto en donde L~ tiene una magnitud In Lp(w) a

~----------::e'-----~--Valor .. , 1 de d·c

Lp~------------

1

\1

\

Pendiente- 1/2

~

a 1-a

1

__.j1

1\ 1 ' 11 ' ..... _ ......1

-lnw

(a) Figura 13.19.

(b)

"'O

(a) Gráfica de L~(W) tal como lo indica (13.6-40) en función de w. (b) Gráfica de la ganancia de corriente en función de la frecuencia, de acuerdo con los resultadvs de la sección 13.6, en donde se muestran las frecuencias de corte de a y de (3, Wo y w~.

comparable con d y en esta región de frecuencia, el valor de f y, por ende, el de a, es notablemente menor que la unidad, como se indica en la figura 13.19(b). La ganancia de corriente en esta región comienza a reducirse en comparación con su valor de frecuencia cero. La "frecuencia de corte a" del dispositivo, w 0 , se puede definir como sigue (13.6-44) Substituyendo este valor de L~ en (13.640) y despejando la frecuencia, se tiene

2jDPJDPrPwo=-d- --;¡r--1.

(13.6-45)

Para frecuencias que sobrepasan este valor, la ganancia de corriente es mucho menor que el que se tiene a la frecuencia cero. Es obvio que para lograr altas frecuencias de corte, se requieren valores pequefios en la anchura de base y valores grandes en los tiempos de vida en la región de base. Antes de concluir con el tema de los transistores, se estudiará brevemente el circuito de emisor a tierra y el circuito de base abierta de estos dispositivos. En el circuito que aparece en la figura 13.16 (circuito de base a tierra) se supuso que se

474 Rectificadores de unión p-n y transistores

introdujo un incremento de corriente die al electrodo emisor. Como se ilustra en la figura 13.20, en el circuito de emisor conectado a tierra se introduce una señal de corriente dib al cable de base. De acuerdo con la continuidad de la corriente, se debe tener siempre (13.6-46)

de donde, (13.6-47)

Figura 13.20.

Circuito de emisor a tierra de un transistor p-n-p.

No obstante, por definición, die =die/a, de donde, ex di = - - dib = f3dlb e 1 -ex

(13.6-48)

f3 =die= _ex_ dlb 1- ex

(13.6-49)

La cantidad

es la ganancia de corriente de emisor a tierra del transistor. Evidentemente, esto demuestra que la configuración del circuito de emisor a tierra se puede emplear para proporcionar factores de amplificación de corriente mayores que la unidad. La configuración de emisor a tierra es la disposición del circuito que se usa con mayor frecuencia en amplificadores de transistor y es algo análogo, desde el punto de vista eléctrico, al amplificador de tubo al vacío con el cátodo conectado a tierra, en donde el emisor corresponde al cátodo, la base a la rejilla y el colector a la placa del tubo al vacío. La frecuencia de corte para la conexión de emisor a tierra es menor que para el mismo transistor en la configuración de base a tierra, ya que si el valor de a a la frecuencia cero es casi igual a la unidad, como sucede casi siempre, sólo se requiere una pequeña reducción de a para producir un porcentaje de reducción mucho mayor en a/(1 -a). Esto se ilustra por medio de la curva punteada de la figura 13.19(b), en donde la frecuencia de corte de (3, w~, a la que la ganancia del emisor a tierra se reduce por el mismo factor que la ganancia de base a tierra en la frecuencia de corte de a, w 0 , es considerablemente menor que la frecuencia de corte de a. Otro efecto interesante del funcionamiento del transistor de unión, es la autoamplificación de la corriente de saturación del colector en un circuito de base abierta, tal como se señala en la figura 13.21. En este caso, las corrientes de emisor

Transistores de unión p-n-p y n-p-n

475

y colector deben ser iguales y, por tanto, a condición de que la magnitud del voltaje de batería sea mucho mayor que kT/e, se debe tener, de acuerdo con {13.6-2), (13.6-50)

en donde,

1=~ e 1 - OC

(13.6-51)

~-~-c-=-4--------------~ ~ Figura 13.21.

Autoamplificación de una corriente de colector en un circuito de base abierta.

Por tanto, en este circuito, la corriente de colector se autoamplifica por un factor de 1/(1 -a). Este efecto proporciona una forma muy sencilla aunque aproximada para medir la ganancia de corriente en c-d de un transistor de unión. La corriente de saturación del colector leo se determina primerame~te abriendo el circuito del emisor y completando el circuito de base, observando la cantidad de corriente que fluye. A continuación se abre el circuito de base y se cierra el de emisor, como se indica en la figura 13.21, y se determina la corriente de colector autoamplificada por esta operación. Entonces, la ganancia de corriente se puede determinar a partir de (13.6-51). Esta autoamplificación de la corriente de saturación proporciona también la base para comprender el funcionamiento de los dispositivos de coiUI1utación de cuatro capas p-n-p-n que se verán detalladamente en un capítulo posterior. Aunque los estudios de esta sección se han limitado exclusivamente a los transistores de unión p-n-p, es obvio que se puede realizar un análisis idéntico para las unidades n-p-n, llegando a ecuaciones que son iguales a las que se derivaron antes, con la excepción de que los subíndices n y p deben intercambiarse y la cantidad b se substituye por 1/b. Sin embargo, debe hacerse notar que los voltajes de polarización que deben usarse en conexión con las unidades n-p-n, tienen el signo inverso con respecto a los correspondientes a los transistores p-n-p.

EJERCICIOS l. Analice la forma restrictiva de la característica corriente-voltaje de un rectificador ideal de unión p-n, como el que se vio en la sección 13.1, conforme la temperatura tiende a cero. ¿Qué es lo que determina la máxima temperatura de funcionamiento práctico para el dispositivo? 2. Demuestre que la aplicación de las condiciones exactas de frontera (12.3-1) y (12.3-2) a las soluciones (13.1-14) y (13.1-15) para el rectificador de unión p-n de la sección 13.1 en donde la variación de la concentración de portadores mayoritarios, debida a la presencia de Ja

476

Rectificadores de unión p-n y transistores

distribución de portadores en exceso no se desprecia, lleva a una característica corriente-voltaje de la forma

Se puede suponer que la razón de movilidades b es muy cercana a la unidad y que los perfiles de concentración (13.1-14) y (13.1-15) no se ven gravemente afectados por los fenómenos de transporte ambipolar. Observe que esta ecuación predice que J ~oo conforme V0 ~%­ lo cual significa que la barrera de potencial interno de unión nunca se "allana" por completo, ni en corrientes muy grandes. Evidentemente, la expresión se reduce a los resultados previos para voltajes inversos y directos que son pequeños en comparación con (/>o. Desde el punto de vista experimental y en condiciones de alta corriente, en lugar de comportarse como se predice, la desviación de la curva corriente-voltaje de la forma ideal tal como la da (13.1-23), está en dirección opuesta, como lo indica el diagrama adjunto. La razón se basa no tanto en el hecho de que la expresión anterior no representa correctamente la relación existente entre la caída del voltaje de unión y la corriente, sino más bien en que (a) a altas corrientes, se producen grandes caídas Óhmicas de voltaje adicionales en las regiones volumétricas a ambos lados de la unión y (b) en condiciones de corriente elevada, una estructura de rectificador por aleación de tamaño finito puede actuar como una estructura de tres regiones p-(intrínseca)-n, en donde todos los portadores inyectados a la región n cuya impurificación es moderada están obligados a permanecer ahí hasta que se recombinan. Esta región se inunda con pares electrón-hueco, la concentración de estos pares aumenta a un valor que sobrepasa enormemente a la concentración normal de portadores mayoritarios de equilibrio, por lo cual, la región se comporta de un modo muy semejante a un capa intrínseca semiconductora. El contacto metálico del lado opuesto de esta capa, que casi siempre se hace con una soldadura que contiene una concentración bastante grande de impurezas donadoras, forma una capa tipo n

1

Ecuación (13.1-23)

1

1

¡ Teórica

L-

Experimental (~e•Vo/

ur¡

1

1

delgada, recristalizada y con fuerte impurificación, que termina al otro lado del disposibvo. Una investigación de las características de un dispositivo de esta Índole (como el que se presenta en el siguente capítulo) da como resultado una relación corriente-voltaje que concuerda muy bien con los que se obtuvieron en rectificadores reales de este tipo en las mismas condiciones. 3. A 600°C, el contenido de germanio en fase líquida indio-germanio en equilibrio con germanio SÓlido, es aproximadamente un 20 por ciento atómico, como se determina mediante el diagrama de fase binaria de In-Ge. Si se utiliza el valor K de equilibrio que se indica en la tabla 11.1, calcule la concentración de receptores en la capa p recristalizada de un rectificador de aleación p-n fabricado fusionando un trozo de indio sobre germanio tipo n, aumentando la temperatura a 600°C y enfriando gradualmente. Efectúe el mismo cálculo para un rectificador

Transistores de unión p-n-p y n-p-n

477

hecho en la misma forma, utilizando una aleación de indio que contiene S por ciento de galio atómico. ¿Qué aleación se preferirá para formar el emisor de un transistor de unión p-n-p? 4. Suponga que se superpone un pequeño voltaje en c-a V1 eiwr al voltaje uniforme en c-d Vo que se aplica al rectificador p-n de la sección 13.1. Suponiendo que V 1 ~kT/e, encuentre una solución de la ecuación de continuidad dependiente del tiempo para huecos en la región n que se reduzca al valor correcto de c-d para W= O y que tienda a cero en ellúnite en donde x ~oo. Para mayor facilidad, deberá despreciarse el espesor de la región de carga espacial de la unión en com· paración con la longitud de difusión. S. Use la solución obtenida en el problema 4 para encontrar la característica corriente-voltaje en c-a de la unión p-n de la sección 13.1. Demuestre que la impedancia en c-a del dispositivo es similar a la de una resistencia y un capacitor conectados en paralelo. Encuentre expresiones para la capacitancia equivalente en los límites de baja y alta frecuencia, y observe que, aunque la capacitancia equivalente es casi siempre una función de la frecuencia, en el límite de baja frecuencia se hace independiente de ésta, al igual que un condensador ordinario. La capacitancia obtenida de esta manera se asocia con el almacenamiento y la difusión de portadores de carga en exceso en las regiones volumétricas p y n del dispositivo, y es muy distinta de la capacitancia de carga espacial que se vio en la sección 12.S. Esta componente de la capac!tancia del dispositivo se conoce a veces como capacitancia de inyección o capacitancia de difusión. 6. Utilice las expresiones exactas (13.6-26), (13.6-27) y (13.6-28) para escribir las corrientes de emisor y colector y, calculando directamente a partir de la definición (13.6-12) la cantidad

die di,

die dV, dV,. di,

oc=-=-

demuestre que la expresión (13.6-31) para a se obtiene independientemente de cualquier suposición en lo que respecta a la magnitud del voltaje de emisor. El método adoptado en el texto se utiliza debido a que presenta con mayor claridad los papeles independientes de la eficiencia de inyección y el factor transporte.

LECTURAS RECOMENDADAS J. K. Jonscher, Principies of Semiconductor Device Operation, G. Bell and Sons, Ltd., Londres (1960). Allen Nussbaum, Semiconductor Device Physics, Prentice-Hall, Inc., Englewood Cliffs, N. J. (1964), capítulo 4. W. Shockley, "The Theory of p-n Junction Semiconductors and Junction Transistor," en Bel/ System Technical Journal 28, 43S-489 (1949). A. van der Ziel, Salid State Physical E/ectronics, Prentice-Hall, Inc., Englewood Cliffs, N. J. (19S7), capítulos 13 y 14. Proc. lnst. Radio Engrs., "Transistor Issues," 30 (diciembre 19S2) y 46 Uunio 19S8).

Uniones p-n a niveles altos de corriente; El rectificador p-i-n 14.1

UNIONES p-n A DENSIDADES ALTAS DE CORRIENTE

En la seccwn 13-1, se presentó el análisis del rectificador de unión p-n, restringiéndose la validez del mismo a la región de polarización inversa y a los valores de voltaje de polarización directa que son pequeños, en comparación con la barrera de potencial interno en equilibrio 1/>0 • Esta restricción tiene varias razones, las más importantes son las que siguen: (i) En la región de polarización directa, a altos niveles de corriente, las condiciones simples de frontera (13.1-12) y (13.1-13) ya no son válidas, porque la concentración de los portadores minoritarios inyectados en las regiones volumétricas p y n, cercanas a la unión, pueden ser comparables a la densidad de portadores mayoritarios en equilibrio en este punto. En tales circunstancias, la distribución de portadores mayoritarios que acompaña a los portadores minoritarios para asegurar la casi neutralidad, es tan densa que perturba gravemente la concentración de portadores mayoritarios, cerca de la unión de su valor de equilibrio. Por tanto, las condiciones exactas de frontera (12.3-1) y (12.3-2) deben usarse en lugar de las aproximadas (13.1-12) y (13.1-13), (ü) A altos niveles de corriente directa, la densidad de portadores minoritarios inyectada cerca de la unión puede ser tan grande, que el total de las densidades de portadores mayoritarios y minoritarios en esa región tengan una magnitud comparable. Los coeficientes de transporte ambipolar D* y f.l*, tal como los da (10.2-34) y (10.2-35), en este caso se deben utilizar en la ecuación de continuidad, en lugar del coeficiente de difusión de los portadores minoritarios y la movilidad, que se aplican sólo a densidades bajas de portadores en exceso. Si la razón de movilidad b es grande, en comparación a la unidad (como puede suceder en algunos de los semiconductores intermetálicos III-V), este efecto puede tener una gran importancia, en tanto que si b es relativamente pequeño (como lo es en el silicio y el germanio), no se encontrará un cambio muy grande en las características del dispositivo. (iü) A niveles altos de corrientes no se pueden omitir los campos eléctricos originados de los gradientes de concentración y de la caída óhmica de voltajt', en las regiones volumétricas p y n. Se puede hacer una corrección de la característica corriente-voltaje del rectificador p-n de la sección 13.1, tomando en cuenta sólo el efecto que se vio antes en (i). El resultado se dio y analizó en relación con el ejercicio 13.2; el lector puede consultar esta exposición para ver los detalles de la situación. La conclusión es que, en general, los efectos de (ü) y (iü) anteriores, junto con otros fenómenos 479

480

Uniones p-n a niveles altos de co"iente; el rectificador p-i-n

Terminal de Cobre Región n+ delgada recristalizada

·~--~~--~~~~--. Ge

Soldadura que contiene impurezas donoooras (Sn +Sb) Figura 14.1.

Diagrama de corte transversal de un rectificador de aleación, en el que se muestra la estructura p+-n-n+.

que se describirán en breve, tienen tal importancia, que el resultado obtenido en esa forma difícilmente puede aplicarse por sí solo, para explicar la relación corrientevoltaje de dispositivos reales, en la región de polarización directa. Además de estos tres efectos, las características de nivel de corriente elevada de muchos rectificadores reales p-n (sobre todo los que se fabrican mediante procesos de aleación), difieren de las que se esperan, basándose en la teoría de la unión p-n de corriente baja, debido a que en la región de altos niveles de corriente, esos dispositivos actúan como estructuras que tienen tres regiones distintas, una tipo p, intrínseca, y tipo n, separadas por dos uniones (p-intrínseca e intrínseca-n). Por lo común, esta estructura se conoce como rectificador p-i-n. La razón de este estado de cosas se puede entender, consultando la figura 14.1, que en un corte transversal muestra la construcción de un rectificador de unión p-n de aleación. Se ha formado una región p sumamente impurificada, mediante la aleación de un trozo de indio sobre una oblea de germanio tipo n, con un contenido moderado de impurezas donadoras, 1 casi siempre del orden de 10 15 donadores por cm 3 • Con frecuencia la región fuertemente impurificada se identificaba como región p+. Aquí, se adoptará esta notación y se usará en forma sistemática. Durante el mismo ciclo de calentamiento, en el que se forma la unión p+ -n, se acostumbra soldar la oblea de germanio a una base de níquel con una soldadura de estaño, que lleva impurezas donadoras tales como el antimonio. El objetivo es establecer un contacto "óhmico" entre el germanio y el níquel. Evidentemente, una soldadura que contenga impurezas receptoras tenderá a disolver parte del germanio y a depositar una capa recristalizada p+, cuando se enfría, para formar la segunda unión n-p+, cuya naturaleza sería indeseablemente, no óhmica. Por tanto, se acostumbra utilizar una soldadura que contenga una pequeiia concentración de impurezas donadoras. En este caso, se forma una capa recristalizada de n+, en la misma forma, entre el germanio y la soldadura, y se tiene una unión n-n+ en la interfaz entre esta capa y el cristal original. La estructura resultante es un dispositivo p+-n-n+; pero, a densidades de corriente baja, tales como las que se encuentran en la condición de polarización inversa o una pequeiia polarización directa, la unión n-n+ actúa en forma algo semejante a una unión p-n que tiene una corriente de saturación extremadamente grande y, por tanto, características de rectificación muy deficientes (vea la ecuación (13.1-24)), 1 Mayores concentraciones de donadores darían como resultado valores e_xcesivos del carn· po eléctrico dentro de la región de carga espacial y, por tanto, menores voltajes de ruptura de avalancha. (Véase la tabla 12.1.)

El análisis del rectificador p+·i-n+ a niveles altos de corriente

481

aproximándose así al comportamiento de un contacto óhmico. Sin embargo, a valores más elevados de voltaje de polarización directa, la unión p+-n inyecta un gran número de huecos en exceso y si la concentración de éstos es de mayor o del mismo orden de magnitud que la densidad de electrones en equilibrio dentro de la región central n moderadamente impurificada, entonces las concentraciones totales de electrones y huecos en dicha región son comparables2 y la región se comportará en forma muy semejante a un cristal semiconductor intrínseco. La representación de altos niveles de corriente del dispositivo, se justifica entonces plenamente como una capa intrínseca limitada a la izquierda por una unión intrínseca p+ y, a la derecha por una unión intrínseca n+, es decir como un rectificador p+-t-n+. El análisis de un dispositivo de este tipo ilustra las técnicas generales que deben emplearse para todos los dispositivos a altos niveles de corriente.

14.2

EL ANALISIS DEL RECTIFICADOR p+.;.n+ A NNELES ALTOS DE CORRIENTE

En esta secc10n, se examinarán las propiedades en la región de altos niveles de corriente, de un dispositivo unidimensional p+-J-n+, como el que se ilustra en la figura 14.2. En este dispositivo, se supone que las concentraciones en equilibrio de portadores mayoritarios Ppo y nno en las regiones p+ y n+, son mucho mayores que la concentración en equilibrio de portadores mayoritarios n 0 en la región central con una impurificación moderada. Se puede hacer caso omiso de la penetración fmita de las regiones de carga espacial de la unión hacia la capa central (en las condiciones de polarización directa) en comparación con el espesor total 2d de esta capa; la recombinación de los electrones y los huecos en exceso dentro de las regiones de carga espacial, puede también desecharse. No obstante, se supone que la casi neutralidad eléctrica asociada con la difusión ambipolar de portadores excedentes, se mantiene en todas partes fuera de las capas de carga espacial de la unión. También se supondrá que toda la corriente que cruza la unión en x = - d, es una corriente de huecos y que toda la corriente que cruza la unión en x = + d es una corriente electrónica. Esto equivale a suponer que la eficiencia de inyección de huecos de la unión p+.¡ y la eficiencia de inyección de electrones de la unión

Concentraciones equilibrad~ de portad ores: Ppo, nP•

Región-p+. x=-d

Figura 14.2.

n,o,

Región-n+

Casi intrrnseco 1 x=O

Pno

X=

d

x-

Geometría y notaciones del rectificador planar p-i-n, que se vio en la sección 14.2.

2. Se verá que esto es cierto, a pesar de que la concentración de huecos excendentes va acompañada de una concentración idéntica de electrones en exceso para satisfacer los requisistos de la casi neutralidad.

482

Uniones p-n a niveles altos de corriente; el rectificador p-i-n

i-n+ equivalen a la unidad. La eficiencia de inyección de huecos [tal como lo muestra (13.1-28) en el caso de niveles bajos], depende de la razón de la concentración de electrones en la región n a la de huecos en la región p. Si esta razón es pequeña, la eficiencia será prácticamente igual a la unidad; si no es así, será mucho menor. En lo que respecta a la unión p+-i, esta relación es pequeña a una corriente cero y seguirá siéndolo hasta que la concentración de portadores excedentes de la región central sea comparable con la concentración de huecos en equilibrio, dentro de la región p+. Esta suposición, aunque se justifica todavía para las densidades inyectadas de portadores en exceso en la región central, que son muy superiores a la densidad normal de equilibrio de los portadores mayoritarios n 0 en esa región, tendrá una ruptura cuando esta densidad en exceso se acerque a Ppo. Entonces, aunque este análisis se extiende muy adentro en la region de altos niveles de corriente, tendrá una validez dudosa, más allá de cierto punto. Se pueden formular argumentos similares concernientes a la eficiencia de inyección de electrones en la unión n-n+, llegando a la conclusión de que el considerar eficiencias de inyección unitarias es correcto, siempre y cuando Ppo y nno sean grandes, en comparación con la mayor de las tres cantidades (p 0 , n0 , f>p ), en donde f>p es la densidad de portadores en exceso en la región central. Esta suposición equivale también a la proposición de que todos los huecos inyectados en el lado izquierdo de la unión de la figura 14.2 se recombinan dentro de la región - d < x < + d, en lugar de hacerlo en la región n+ a la derecha, siendo lo mismo en el caso de los electrones que se inyectan en la unión del lado derecho. Aunque es cierto que los electrones y los huecos inyectados están obligados a permanecer dentro de la región central, debido a las barreras de potencial electrostático en las uniones, como se ilustra en la figura 14.3, es evidente que, para voltajes de polarización directa lo suficientemente altos, los portadores en exceso pueden derramarse hacia las regiones extremas, antes de recombinarse. No obstante, para muchas estructuras de estos dispositivos, puede esperarse que esta suposición se aplique lo bastante bien a valores de corriente que quedan más allá de los límites de la teoría de nivel bajo. Para las condiciones en que no se aplica la proposición, las condiciones físicas se hacen muy complejas, ya que incluye regiones de nivel alto y bajo, que no están bien defmidas, e introduce en el problema condiciones de frontera sumamente complejas. En las condiciones supuestas, la ecuación de continuidad ambipolar de estado estacionario (10.2-26) que describe la densidad de portadores en exceso f>p(x) = f>n(x) dentro de la región central, y que se supone se comporta esencialmente como un semiconductor intrínseco a los niveles de corriente comprendidos, es

.. ------.... .,

(Un voltaje de polarización directa altura de las dos barreras)

reduce

la

- ---- ----

___ - ----------------------------

•• ++++++ + ++ ++ + + + ++ + + + r + + +

Regi6n-p+

+ +

+

+

+

+

+

+ +

Tipo-n impurificado moderadamente Figura 14.3.

+

+

+

Diagrama de potencial del rectificador p-i-n.

Regi6n-n+

+

El análisis del rectificador p+-i-n+ a niveles altos de corriente

483

(14.2-1) en donde 2 * 2b L-=D-r=--Dr. 1 1 b+1 p

(14.2-2)

En este caso, L¡ es la longitud de difusión ambipolar, D[ es la constante de difusjón ambipolar intrínseca y como la da (1 0.2-36), 7 es el tiempo de vida de los portadores en exceso y b la razón de movilidad es P.n/Jlp = Dn/Dp. Puesto que la movilidad ambipolar p.* es cero en la condición intrínseca, no es necesario conservar el término del campo en (10.2-26). Si 7 es independiente de 8p y x, como se supondrá que es el caso, la solución general de (14 .2-1) se puede escribir en la forma {Jp

=

X

p- Po = n - n 0

X

= A senh- + B cosh L·. L;

(14.2-3)

1

Las ecuaciones que describen el flujo de la corriente eléctrica en la región intrínseca, como la suma de las corrientes de difusión y arrastre, de acuerdo con (10.2-8) y (10.2-9), dp

I P =pe"r-pE- eD P -dx

(14.2-4)

y

(14.2-5) en donde E es la intensidad del campo eléctrico. Como condición de frontera, se ha supuesto que (14.2-6) Si se hace Ip =O y x = d en (14.2-4), observando en (14.2-3) que dpjdx = dnjdx, resolviendo para E e insertando el valor obtenido así en (14.2-5), se puede demostrar que (a x =d).

(14.2-7)

De la misma manera, haciendo que In =O y x = - d en (14.2-5), al resolver para E y el valor resultante en (14.2-4), se encuentra que

~ = / p(- d) = _ D d p ( 1 + E.) e

e

P

dx

n

(a x = -d).

(14.2-8)

Por supuesto, el total de densidad de corriente I debe ser el mismo en todos los puntos, como es el caso del rectificador p- n de la sección 13.1, como se explicó en relación con las ecuaciones (13.2-3) y (13.2-4). En la región central, n se da como la suma de la densidad de equilibrio n 0 y la densidad de electrones en exceso 8P. De igual manera, p es igual a Po + 8P; pero se está investigando el dis-

484

Uniones p-n a niveles altos de corriente; el rectificador p-i-n

positivo en condiciones de corriente y polarización directa tales que lip sea mucho mayor que n 0 o p 0 • En esas condiciones, pfn:::!. nfp:::!. 1 y (14.2-7) y (14.2-8) se convierten en (14.2-9) Ahora, si se escribe dp/dx como función de x a partir de (14.2-3), al substituir las condiciones de frontera, (14.2-9) para x = d y x =- d, y resolviendo para las constantes A y B, se puede obtener A= _

IL1(b - 1)

B = IL1(b

y

d

+ 1)

d' 4ebD, senL;

4ebD, cos L.

'

(14.2-10)

por lo cual, (14.2-3) se puede expresar como

X

X]

senhcoshL· L. ~p(x) = - - (b + 1) - - ' - (b - 1) - - · 4ebD, cosh -d se nh -d L1 L1 IL1

[

JL.

[

--.....;'-2-d (b

d

X

+ 1) cosh L· cosh L.

2ebD,senhL;

'

d]

X - (b- 1)senh -senh. L1 L1

'

(14.2-11)

En la region central, cerca de los bordes de la umon, las concentraciones de portadores en exceso inyectados, se pueden relacionar con las concentraciones correspondientes de equilibrio de los portadores mayoritarios en las regiones p+ y n+ (suponiendo que 6p es ahora mucho más pequeño que cualquiera de las concentraciones de portadores mayoritarios nno y Ppo en la parte exterior de las regiones con muchas impurezas), mediante las condiciones de frontera de la forma (13.1-12) y (13.1-13), para dar 3 p( -d) ~ ~p( -d) = Poe"v,¡kT

(14.2-12)

y

(14.2-13)

3 El uso de las condiciones de frontera de la forma (13.1-12) y (13.1-13) en lugar de las formas más generales (12.3-1) y (12.3-2), en las que se toman en cuenta los efectos debidos a las densidades de portadores mayoritarios en las regiones exteriores fuertemente impurificadas, debido a la presencia de portadores inyectados a estas regiones por las uniones, equivale a hacer caso omiso de los efectos que se vieron en la sección 14.1, en el punto (i) y en el ejercicio 13.2. Sin embargo, si las regiones n + y p + están muy impurificadas, no hay muchos errores hasta que se llega a niveles de corriente muy elevados.

El análisis del rectificador p+-i-n+ a niveles altos de corriente

485

en donde V 1 y V 2 son los voltajes aplicados que aparecen en las uniones izquierda y derecha, en la figura 14.3, respectivamente. Al substituir estos valores en (14.2-11) y al simplificar, se puede ver claramente que

~p( -d) =

IL1(1 + b cosh 2d) Poeev.¡kT

L;

=

2d

(14.2-14)

2ebDPsenhL; y

~p(d)

= noeeY /kT =

IL1( b + cosh ~)

1

2d 2ebDPsenh-



(14.2-15)



Si se multiplican entre sí las ecuaciones (14.2-14) y (14.2-15), al resolver para I y recordando que n0 p 0 = nl , se encuentra que

(14.2-16)

1000.--------------,

'O

..S

T

10 0

..!? +

....

0

o

= 296"K

A • 1 50 x I0-2cm 2 A/0 • O 013mo

Espesor de la base= 0026 cm

0.01 L--L----''----'----'---1.----L-~ o 0.1 o 2 0.3 0.4 0.5 0.6

Voltaje Figura 14.4.

Relación de corriente y voltaje de un rectificador de aleación real, ilustrando las regiones separadas de pendientes e/kT y e/2kT, correspondientes a las regiones de nivel de corriente baja y de corriente alta. (Figura por cortesía del Dr. H. F. John, Westinghouse Research Laboratories.)

486

Uniones p-n a niveles altos de corriente; el rectificador p-i-n

Se observará que la corriente en sentido directo se relaciona con la caída total de vo!taje V¡+ v2 a través de las uniones, mediante el factor ee(V¡ +v2)f2kT y no con el factor (eeVofkT- 1) que se presenta en la teoría de nivel bajo de la sección 13.1. El planteamiento de corriente baja de la sección 13.1 predice, por tanto, que una gráfica de 1n(/ + / 0 ) en función del voltaje, debe ser una recta cuya pendiente es efkT, en tanto que la teoría p-i-n predice una recta con una pendiente ej2kT. En la figura 14.4 se muestra una gráfica experimental de la curva corriente-voltaje real de un rectificador p-n de aleación de germanio, dentro de la región de polarización directa. En este diagrama se puede distinguir una región lineal de pendiente ejkT a voltajes inferiores a aproximadamente 0.1 V, en donde se puede esperar que la teoría de nivel bajo será muy apropiada, y otra región lineal con una pendiente e/2kT a voltajes más altos (0.2-0.45 V), en donde puede esperarse que se apliquen las condiciones de la teoría p-i-n. Además del voltaje de las uniones, existe una caída de voltaje adicional que aparece en la región central y que se origina de los efectos óhmicos y los gradientes de concentración de la capa casi intrínseca. Esta caída de voltaje se puede determinar, calculando el campo dentro de la región central e integrando sobre esa porción de la estructura. El campo se puede determinar, sumando las dos ecuaciones de corriente (14.2-4) y (14.2-5), para obtener una ecuación de la corriente total, resolviendo para el campo y utilizando las relaciones de Einstein (10.2-11), para obtener 1 [I - kT dp] E(x)=-- (b-1)-. nb + p eJLp e dx

(14.2-17)

En las condiciones que prevalecen en la región central, p ~ n ~ op y (14.2-17) se convierten en E(x)

1

d
= - - = ---:-dx

eJLp(b

+ 1)~p

_ kT b- 1 . ..!__ d(~p) e b + 1 ~p dx

(14.2-18)

Este resultado concuerda evidentemente con (10.2-39). Al integrar desde - d hasta d para encontrar la caída de voltaje interno V¡, se puede escribir
dx kT b- 1 Id +-d(ln ~p) I-ddE(x) dx = eJLp(b-1+ 1) Id-d -~p(x) e b + 1 -d

(14.2-19) o bien, V.= '

1 eJLp(b + 1)

Id -d

~-kTb-1ln~p(+d)_ ~p(x)

e b+1

~p( -d)

(14.2-20)

Al substituir el valor de op(x) a partir de (14.2-11), el valorop(+d)/op(-d) de (14.2-14) y (14.2-15), integrando y haciendo las operaciones algebraicas tediosas, para simplificar la expresión resultante, se tiene que

El análisis del rectificador p+-i-n+ a niveles altos de corriente

J

1[

(b- 1) 2

487

2

d senh -2d tan- senh1 - - - tanh -d] 4b kT L; L; b+1 L; V¡= -1-+-b-e . _ _....:..___ J=:==,;,~=,;,..,-=2=d..:..__ _~

l

+ b 2 + 2b cosh -

L;

_ kT b _ 1 In ( b + cosh eb+l

~).

b h2d 1 + cos -

(14.2-21)

L;

De acuerdo con esta expresión, la caída interna de voltaje V¡ es independiente de la corriente. Físicamente, se obtiene este resultado porque, aunque un incremento de 1 tiende a aumentar óhmicamente a V¡, tiende también a incrementar a op, lo cual produce una reducción de V¡; estos dos efectos opuestos se anulan, dejando a V¡ independiente de /. El voltaje total V0 aplicado al dispositivo (haciendo caso omiso de las caídas de voltaje en los contactos o en las capas p + y n +, con muchas impurezas), se reduce a la suma de los tres voltajes que se dieron antes: (14.2-22) Al sumar las expresiones de los tres voltajes, que se obtuvieron en (14.2·16) y (14.2-21) y simplificando [sin olvidar que D! = 2bDp(I + b)], se obtiene V0

2kT IL1 =- [ In--*+ lf)b(d/L;) ] e

en 1D1

(14.2-23)

en donde

_ [J (1 + b cosh+ l)senh 2~)( b + cosh 2~)] 2~

lf)h(~) -In

(b

(14.2-24) Por tanto, la caída de voltaje directo en el dispositivo se da como la suma de un término logarítmico en la corriente y un término independiente de ésta. La pendiente de una gráfica de In I en función de V0 , es claramente e/2kT. Se debe observar que, en vista de las suposiciones iniciales y las aproximaciones que se han hecho, esta expresión se aplica sólo a la región de altos niveles de corriente directa y ya no será correcta como 1---* O. El hecho de que (14.2-23) dé un voltaje diferente a cero para 1 = O, se puede explicar mediante esta observación. El uso de la teoría de altos niveles de corriente requiere que op sea grande, en comparación con la densidad de equilibrio de los portadores mayoritarios n 0 de la región central. Se puede demostrar que esto equivale al requisito de que

488

Uniones p-n a niveles altos de corriente; el rectificador p-i-n

J-

I e(b

• Di ~ no.

+ 1)

(14.2-25)

Los detalles de esta proposición se asignan como ejercicio para el lector. En el caso del silicio, en donde b - 4 y D( = 16, esto conduce al requisito de que (3.1 + 10 14 ) I.Ji sea grande en comparación con n 0 , I grande se expresa ,en amp/ cm 2 , T en microsegundos y n 0 en cm- 3 • En la figura 14.5 se muestra la gráfica de la función IPb para b = 1 y b = 4. Se observará que b(~) va al infinito, conforme el argumento tiende ya sea a cero o a infinito, y tiene un mínimo para un valor del argumento que depende en parte de b; pero es igual a, aproximadamente 0.7 para b = 4. Sin embargo, el valor mínimo de V0 a una corriente constante dada, no se produce al valor mínimo de b, debido a la presencia del término logarítmico de (14.2-23). En efecto, se puede demostrar que, para una estructura en la que la anchura d es constante, la caída mínima de voltaje Ve para una densidad de corriente dada, se produce a un valor de L; determinado por la condición (14.2-26)

en donde ~ =

(14.2-27)

d/L¡.

La prueba de este enunciado queda como ejercicio para el lector. En la práctica, es muy difícil obtener analíticamente el valor de L; para una caída mínima de voltaje di· recto y, por tanto, la evaluación de esta cantidad puede hacerse de modo gráfico o numérico. Cuando V0 se grafica en función de L;, de acuerdo con (14.2-23) y (14.2-24), suponiendo que d es constante, se obtienen curvas como las que se ilustran en la figura 14.6. 3.5 3.0

25

carda óhmica de voltaje en rectificad ores p-i-n 1 ---b = 1 1 b=4 1 1 1

1

1

1 1

2.0 b

1 1

1.5

1 1

1

1.0

1 1

05

1

.... "'

/

10

d

15

T Figura 14.5.

La función b(d/L), dada por (14.2-24), para b = 1 (curva punteada)

(curva continua).

y

b= 4

El análisis del rectificador p+-i-n+ a niveles altos de co"iente

..

o

1.0

~

~

~ -.orn•\

\

1.5

···=\

~

Caída en sentido directo de un rectificador p-i·n 100 Amps/cm 2 --300"K (27"C) __ 1-----400" K (127" C)

1\..

r\

~ d=00025cm

489

~.... ....

-- - -- --d• 001 cm

-- -----::::::::::-:

05

o

0001

001

01

L,cm-

Figura 14.6.

Caída de voltaje directa de un rectificador p-i·n, graficada en función de la longitud de difusión de la región central, L, para varios espesores de la región central.

En la mayoría de los rectificadores de unión p-n, la máxima disipación de potencia y la generación de calor interno se producen cuando el dispositivo conduce grandes corrientes en sentido directo. Esto se puede demostrar fácilmente, comparando el producto IV0 para un dispositivo típico como el que se investigó en la figura 14.4 en la región de polarización inversa a V0 = - 500 V y en la región de polarización directa, a una densidad de corriente de 50 amp/cm 2 (véase el ejercicio 7, al final del capítulo). Por tanto, la máxima corriente de carga que puede portarse sin producir una generación de calor interno destructiva, depende críticamente de la caída de voltaje en el dispositivo a valores elevados de corriente directa. Las curvas de la figura 14.6, que se calcularon para rectificadores de silicio p-i-n, ilustran claramente que la mínima caída de voltaje directo se obtiene a un valor óptimo de d/L¡ que, para el rango de condiciones ilustradas en este diagrama, es casi exactamente la unidad. Si el tiempo de vida de los portadores en exceso, dentro de la región central del dispositivo es tan baja que L¡ es mucho menor que d o tan alto que L¡ exceda substancialmente a d, se producirá una caída de voltaje directa excesivamente alta. Desde el punto de vista físico, este estado de cosas se origina debido a que la caída de voltaje de la unión, V 1 + V2 (para una corriente de carga constante dada) se hace demasiado grande cuando L¡ es mucho mayor4 que d, de acuerdo con (14.2-16), en tanto que la caída interna V¡ a través de la región central, se hace muy grande cuando L¡ es mucho menor que d, como lo indica {14.2-21). En consecuencia, se observará un voltaje total mínimo en algunos valores de d, 'IUe no son ni 4 Este comportamiento se predice también mediante la teoría de unión p-n a nivel bajo de la sección 13.1; esto está claramente ilustrado por la ecuación (13.1-23), en .la que, para una

densidad de corriente dada, el voltaje de unión requerido se hace evidentemente grande cuando se permite que tanto Ln como Lp se acerquen al irümito.

490

Uniones p-n a niveles altos de corriente; el rectificador p-i-n

mucho mayores ni mucho menores que L¡. Este resultado ilustra la importancia de mantener en este tipo de estructuras, cuando menos un control aproximado del tiempo de vida de los portadores en exceso. No obstante, se debe observar que el valor de 7 que se necesita en las ecuacione3 de esta sección, no es necesariamente el que se puede obtener en una medición del decaimiento fotoconductivo transitorio que implica sólo una pequeña concentración de portadores en exceso, sino el valor efectivo que prevalece en las condiciones supuestas, dentro de la región central del dispositivo, donde están presentes concentraciones muy grandes de portadores en exceso. Los dos valores pueden ser muy diferentes, en vista de la dependencia de 7 en relación con la concentración, predicha por (10.8-24) y (10.8-25).

14.3

RECTIFICADORES p-i-n; LA CAlDA DE VOLTAJE EN SENTIDO DIRECTO COMO UNA FUNCION DE LA TEMPERATURA

En la figura 14.6, la curva punteada representa la caída de voltaje directo, a una temperatura de 400°K (127°C) para la unidad representada por la curva continua para d = 0.01 cm, que se ha graficado a una temperatura de 300°K (27°C). Se observa que para algunos valores de L¡, la caída de voltaje directo disminuye en este rango de temperatura, en tanto que para otros valores de L¡ (menos de aproximadamente 0.004 cm para este caso) aumenta. Esta situación, algo extraña, se debe a que el voltaje interno V¡ tiene una dependencia en función de la temperatura, que difiere de la de los voltajes de unión. Para un rectificador "ideal" de unión p-n, como el que se dio en la sección 13.1, se podría esperar, de acuerdo con (13.1-23) que

1)

kT ( 1 +V0 =-In

e

(14.3-1)

/0

en donde / 0 es la corriente de saturación. Sin embargo, si se considera un dispositivo en el que la región tipo n está menos im~urificada que la región p y en la que, por tanto, Pno ~npo. lo es epnoDp/Lp = en¡Dp/nnoLp. No obstante, de acuerdo con (9.3-21), en tanto la estadística de Boltzmann sea válida, nl se puede expresar en la forma (14.3-2) en donde C = UcUJJ'3 es una constante independiente de la temperatura. Al substituir este valor en (14.3-1) y suponer que 1/10 ~ 1 -lo cual es cierto para todos los voltajes directos, excepto los muy pequeños- se encuentra que V0

L\e kT l /Lpnno 3kT =-+n - - - - - I n T. e

e

eCDP

e

(14.3-3)

En el rango normal de temperaturas, concentraciones, tiempos de vida, etc., y para densidades de corriente para las que se puede aplicar esta fórmula, se encuentra que, el tercer término predomina sobre el segundo y, como resultado, V 0 disminuye con la temperatura. 4-quí se ha supuesto que la longitud de difusión cambia con la temperatura sólo a través del cambio en el coeficiente de difusión y, por tanto, que el tiempo de vida es independiente de la temperatura. Desde luego, cualquier efecto

Rectificadores p-i-n; la caídade voltaje en sentido directo

491

debido a un cambio en el tiempo de vida, en función de la temperatura, se superpondrá a los resultados que se dieron para este caso más sencillo. En todos los estudios subsecuentes se hará el mismo planteamiento. En el caso del rectificador p-i-n, al funcionar en la condición de polarización directa a altas corrientes, se debe proceder inicialmente de (14.2-23) y (14.2-24). Para explicar la variación del coeficiente de difusión Di con la temperatura, se observa que, puesto que los coeficientes de difusión Dp y Dn se relacionan con las movilidades correspondientes a través de las relaciones de Einstein, entonces, la difusibilidad ambipolar Di de (10.2-36) se puede escribir como sigue (14.3-4)

De donde, el coeficiente de difusión efectivo es kT/e multiplicado por una expresión que incluye la movilidad de electrones y huecos. Si b es lo bastante independiente de la temperatura, la dependencia de la temperatura de Di se relaciona con la de la movilidad de arrastre de los huecos multiplicada por un factor de T. De no ser así, la dependencia de temperatura es más compleja, aunque todavía se puede describir mediante (14.3-4), si se introducen los datos de movilidad de huecos y electrones. Luego la dependencia de la temperatura de L¡ se obtiene de la de Di por medio de (14.2-2). En la práctica la variación con la temperatura de las movilidades se puede describir también casi siempre mediante una ley de potencias, como, por ejemplo (14.3-5) En donde n es una constante positiva, como se vio en el capítulo 9. Si el mecanismo de dispersión dominante que determina la trayectoria libre media y, por ende, la movilidad, es la interacción de electrones y huecos, con fonones de modo acústico, n será 3/2; si el modo óptico o la dispersión entre valles es importante, n será mayor. En el silicio, n (como se determina experimentalmente) no es muy diferente de 5/2, tanto para huecos como para electrones. En el germanio, n = 1.65 para electrones y 2.3 para huecos. Si se adopta (14.3-5) para expresar la dependencia de la movilidad en función de la temperatura, y suponiendo que b es prácticamente independiente de la temperatura, de acuerdo con (14.3-4), se puede expresar la variación con temperatura de Di como

Di(T)

= Dio

(Ty)-n+l 0

(14.3-6)

en donde D¡ 0 es el valor de Di a alguna temperatura de referencia T0 • De igual modo, se puede escribir d d ( T )!::....!. L¡ = L¡o T 0 2

(14.3-7)

en donde (14.3-8)

492

Uniones p-n a niveles altos de corriente; el rectificador p-i-n

Al substituir (14.3-5), (14.3-6), (14.3-7) y (14.3-2) en (14.3-23) y simplificando, se tiene el resultado Ae lcT l 2 1: kT V0 = - + - In - (4 - n) - In T e e e 2D;~CT 0 - 1 e

(T)"-

{ d- +2kT --$b e L;o T0

1 2 }

(14.3-9) '

que describe la variación general de V0 en función de la temperatura. Obsérvese que el argumento del logaritmo del segundo término del lado derecho de la ecuación es independiente de la temperatura. Cerca del valor óptimo de d/L¡, la dependencia de V 0 de la temperatura se debe mayormente al segundo y el tercer término del miembro derecho de (14.3-9). Para este rango de valores de d/L¡, la contribución del último término es muy pequeña y la variación general de V0 es descendente al aumentar la temperatura, para valores típicos de los parámetros del dispositivo. No obstante, cuando d/L¡ se hace mucho menor que la unidad, iPb(d/L¡) se hace muy grande y el último término del lado derecho es el que domina, dando como resultado un aumento de Vo con la temperatura. Este término aumenta con la temperatura no sólo debido al coeficiente 2kT/e, sino también a causa de la variación del argumento de
5 kT 2kT { d 114 } -In T + -
--

(n

= 3/2)

(14.3-10)

y

Ae kT / 2 1: V0 = - + - I n 2 D* CT 312 e e e ;o 0

-

3 kT e

-2 -In

(n = 5/2)

2kT { d 3 4} T + -
(14.3-11)

Los resultados que predicen estas ecuaciones para un conjunto típico de parámetros del dispositivo y para una densidad de corriente de 100 amp/cm 2 , se ilustran en la figura 14.7. Es evidente que la tendencia de V0 puede ser ascendente o bien descendente con la temperatura, de acuerdo con el valor de d/L. Una vez más, es obvio que la magnitud de la caída de voltaje directo es muy sensible al tiempo de vida de los portadores en exceso de la región central y que aumenta rápidamente al reducirse este tiempo, después de pasar un punto mínimo. Estas conclusiones se verifican casi siempre mediante las características de dispositivo que se han observado de un modo experimental. Se debe observar que la dependencia en función de la temperatura de la movilidad de arrastre, desempeña un papel importante para determinar este mismo tipo de dependencia de la caída de voltaje directo. Las estructuras

Rectificadores p-i-n; la caída de voltaje en sentido directo 24

493

~

1

1

22

1

1

~ 1T=0625~s

20

18

1

16

L

.. o >

1 Variaci6n de Vf en función de T en un 1 rectificador p-i-n

1

1 1

/

14

o

>

/

/

12

-

10

/

1

1

1

/~ /

,........ ......... ---

'\

T=l56~s

- - - - ~- r -'12 - - - ~-r-Stz

I = lOO amp 1 cm 2 d=OOicm

04~------~------~------~------~--------~

o

50

100

150

200

r, •e Figura 14.7.

Caída de voltaje directa de un rectificador p-i- n, graficada en función de la temperatura, a una densidad de corriente constante de 100 A/cm2 para los dos casos p.o:T-3/2 (curvas continuas) y JPXT-5/2 (curvas punteadas).

de dispositivos en las que la caída de voltaje directo aumenta al incrementarse la temperatura, se consideran casi siempre indeseables, ya que cuando se calientan excesivamente, debido a las corrientes de sobrecarga, aumenta su disipación de potencia interna y tiende a calentarse en exceso, quemándose prematuramente. Por otro lado, las unidades en las que la caída de voltaje directo disminuye al aumentar la temperatura, disipan menos potencia en sentido directo cuando están calientes que cuando do esttm trías, son mucho más estables cuando portan corrientes elevadas y, en general, son mucho más tolerantes a las sobrecargas momentáneas o permanentes. Si se desean más detalles y explicaciones sobre la teoría de los rectificadores p-i-n, conviene leer el artículo original de Hall 5 y el análisis muy minucioso que se hace del tema en la serie de artículos escritos por Herlet y Spenke. 6 5

6

R. N. Hall, Proc. lnst. Radio Engrs., 40, 1512 (1952). A. Herlet y E. Spenke, Z. Angew. Phys., 1, 99 (1955); 7, 149 (1955); 7: 195 (1955).

494

Uniones p-n a niveles altos de co"iente; el rectificador p-i-n

EJERCICIOS l. Para el rectificador de germanio p+-i-n+ que se vio en relación con la figura 14.4, encuentre la longitud de difusión a corriente baja Lp en la región central, de acuerdo con la corriente de saturación dada, suponiendo que la capa central es material de tipo n, con una resistividad de equilibrio de 1 ohm-cm a 300°K, que toda la corriente de saturación es de huecos, dehido a la generación térmica en la región n. Si L¡ a niveles altos de corriente es del orden de Le, ¿se tratará de un dispositivo con pérdidas internas casi óptimas a niveles altos de corriente? Compare la disipación de potencia interna de este dispositivo en la región de polarización directa, a un nivel de corriente de 50 amp/cm2, tal como lo indican los datos experimentales de la figura 14.4, con la disipación de potencia en sentido inverso a un voltaje de V0 = - 500 V, como se calculó mediante la teoría de nivel bajo de la sección 13.1. 2. Muestre explícitamente los pasos algebraicos requeridos para obtener la ecuación (14.2-21), a partir de (14.2-20). Obsérvese que

____dx_ _ _ _ = cxvol-b - 2 tan- (e-•xja_-_b) + const. Jacoshcxx+bsenhcxx a+b 1

2

3. Demuestre (a) que en el caso especial b

= 1,

(14.2-24) se reduce a

(b) que para ~> 1, (14.2-24) puede aproximarse mediante

(e) que para

~o:¡¡,;1,

(14.2-24) se puede aproximar por medio de

4. Demuestre que para una densidad de corriente directa constante dada, en la región de altos niveles de corriente, la mínima caída de voltaje se obtiene cuando la relación ~ = d/L¡ satisface la condición ~(db/d~ = l. 5. De acuerdo con los cálculos anteriores de la sección 14.2 demuestre que la teoría de altos niveles de corriente desarrollada ahí es válida para densidades tan grandes, que permitan que se satisfaga la desigualdad (14.2-24).

CAPITULO

15

Otros dispositivos semiconductores

15.1

EL EFECTO FOTOVOLTAICO p-n Y LAS CELDAS FOTOVOLTAICAS DE UNION p-n

Si una umon ordinaria p-n se pone en cortocircuito en la oscuridad, como se ilustra en la figura lS.l(a), no habrá un flujo de corriente en el circuito externo, a pesar de que existe un potencial c/Jo entre las regiones p y n del dispositivo. La razón es que se desarrollan diferencias de potencial de contacto entre las regiones p y n del semiconductor y los cables metálicos que anulan precisamente el potencial interno en equilibrio. Era de esperarse tal situación, de acuerdo con una base de la termodinámica, ya que, de otra manera, habría un flujo de corriente y se haría un trabajo sin ninguna energía de entrada, lo cual violaría la primera ley de la termodinámica. Si se permite que caiga una luz en la uni6n p-n, como se indica en la figura lS.l(b), la situaci6n cambia materialmente y se pueden observar voltajes y corrientes mensurables. En primer lugar se estudiará el caso en que una uni6n p-n está en circuito abierto. La luz que cae en las regiones p y n, a ambos lados de la unión, crea muchos pares electrón-hueco en exceso, en ambas regiones. El exceso de

Potencial de contacto cuya suma es- 4> 0 .o

Difusión de exceso de electrones

-

(a)

tipo-p

ti po-n

+

Ponteciómetro ( b)

Figura 15.1

(a) Una unión p-n "en corto" en el estado de equilibrio. (b) Una unión p-n iluminada, que presenta el efecto fotovoltaico.

495

496 Otros dispositivos semiconductores Exceso de electrones -

!.!:t~+~!.~+.!±.~!.i!.t~!.+_+_+

+

+ +

+

+

+

-Exceso de ---Bordes de banda (oscuro) ------Bordes de banda (luz) Figura 15.2.

-------------

huec~s

+: + \

~ ++ + :

Diagrama de energía potencial de una celda fotovoltaica.

electrones creado en la región p puede difundirse a la unión y descender por la barrera de potencial hasta el lado n, en tanto que el exceso de huecos creado por excitación óptica en la región n, puede difundirse hasta la unión y "flotar", para pasar la barrera y entrar a la región p. El efecto de esto es colocar una carga positiva neta en el lado p y una carga negativa neta en el lado n. La presencia de estas densidades de carga es tal que reducen la diferencia del potencial de barrera 4> 0 a un valor d!~do 4>o - V0 , como se muestra en la figura 15 .2. El potencial interno es ahora diferente de los potenciales de contacto equilibrantes y un voltaje igual a esta diferencia (con una magnitud V0 ), aparecerá como una diferencia de potencial mensurable en las tenninales del circuito del dispositivo. Este fenómeno se conoce con el nombre de efecto [otovoltaico p-n y el voltaje de salida se denomina con frecuencia [otovoltaje. La magnitud de fotovoltaje se puede expresar de acuerdo con las concentraciones de portadores minoritarios en exceso en las fronteras de las regiones de carga espacial de la unión, por medio de (13.1-12) y (13.1-13) o, mejor aún, mediante (13.1-17) y (13.1-18), de donde

(15.-1)

Si se cierra el circuito externo que conecta las regiones p y n, fluirá una corriente eléctrica, en tanto exista una corriente de difusión de electrones en exceso creados ópticamente, desde la región n, y una corriente de huecos en exceso creados ópticamente, desde la región p, para mantener la altura de la barrera interna a un valor diferente a 4> 0 • Entonces, la corriente fluirá, con tal que estén iluminadas las regiones del semiconductor. Es evidente que la fuente de energía que mantiene el flujo de corriente es la iluminación incidente, que sirve para crear y mantener la distribución de portadores en exceso desde un principio. En la condición de circuito abierto, la generación de densidades de corriente que se vieron al comienzo de la sección 13.1, se incrementan, iluminando el dispositivo, en tanto que las corrientes de recombinación permanecen inalteradas inicialmente. Las corrientes de difusión no balanceadas que fluyen, como resultado de esto, motivan una acumulación de carga, cuyo campo reduce la altura de la barrera interna, incrementando con ello las corrientes de recombinación, hasta que se vuelve a alcanzar un equilibrio entre la

El efecto fotovoltaico p-n y las celdas fotovoltaicas de unión p-n

497

' ' Luz, longitud de' onda1 A coeficiente de absorción o: (A)

Parámetros del material:

~--~r-~--x+d---4 X

I

! Figura 15.3.

x=-d

tipo-p

x=O

tipo-n

Geometría y notaciones que se usan en la celda fotovoltaica p-n de 1a sección 15.1.

corriente de generac10n y la de recombinación; para mantener un voltaje en las terminales del dispositivo. En la condición de circuito cerrado, las corrientes de generación son siempre mayores que las de recombinación (las que, por supuesto, no tienen una dependencia inherente, con la intensidad de la luz), y estas corrientes de generación son las que constituyen la fuente de la corriente que fluye en el circuito externo. Supóngase que una celda voltaica se fabrica, difundiendo impurezas tipo p en un semiconductor que inicialmente es tipo n, de tal manera que se forma una capa delgada tipo p en la superficie. A continuación, la celda se ilumina mediante luz monocromática incidente, en la superficie tipo p. La situación física resultante se puede representar mediante el modelo unidimensional que aparece en la figura 15.3, en donde las regiones uniformes n y p están separadas por una unión abrupta p-n. 1 Se hará caso omiso de la extensión de la región de carga espacial en la unión, ya que, en las condiciones usuales en las que opera el dispositivo, el espesor de las dos capas de carga espacial es extremadamente pequeño. Puesto que la luz incidente es monocromática, su intensidad dentro del cristal se reducirá exponencialmente, en función del coeficiente de absorción o:, que, por supuesto, variará con la longitud de onda, que es muy grande para energías de fotón mayores que ~e y muy pequeña para energías de fotón mucho menores que ~e. Si el número de fotones de longitud de onda A que entran en la superficie frontal del dispositivo por unidad de área, por unidad de tiempo es N0 (A), el flujo de fotones a cualquier profundidad x será (15.1-2) El número de pares electrón-hueco por unidad de área, por unidad de tiempo, generados por la absorción de fotones en una distancia dx alrededor de x, será igual l. Para un estudio completo del efecto fotovoltaico p-n, véase, de R. Wiesner, Halbleiterprobleme, Vol. III, Friedrich Vieweg u. Sohn, Braunschweig (1956), p.p. 56-71.

498

Otros dispositivos semiconductores

a -(dN(x)fdx)dx, de donde, la velocidad de generación de portadores en exceso g' (x) estará dada por (15.1-3) En estas circunstancias, las ecuaciones de continuidad para huecos en exceso en la región n y los electrones de la región p se pueden escribir como sigue d 2(np- npo) dx 2

nP - npo

L:

- - -aNo - e -«(x+d) Dn

(x
(15.1-4)

y d 2(Pn- Pno) dx 2

Pn- Pno =aNo e-~<x+d) L2p DP

(x > 0).

(15.1-5)

Las soluciones de este tipo de ecuaciones se pueden escribir como la suma de la solución de la ecuación homogénea correspondiente a una solución particular de la ecuación no homogénea que pueda encontrarse. Por ejemplo, se puede buscar una solución particular a (15.1-4) de la forma Ce -«(x+d> • y encontrar que esta solución satisfará2 efectivamente (15.1-4), a condición de que la constante C tenga el valor (15.1-6) Luego la solución general de (15.1-4) se puede escribir como (15.1-7) mientras que, en forma similar, la solución general de (15.1-5) se puede expresar en la forma 3 (15.1-8) En el modelo ilustrado en la figura 15.3, se considera que el dispositivo tiene una extensión esencialmente infmita en la dirección + x. Por tanto, puesto .que Pn(x)- Pno debe decaer hasta cero para valores grandes de x, la constante arbitraria C de (15.1-8) debe ser cero. Las otras tres constantes arbitrarias de (15.1-7) y (15.1-8) se pueden ev:>Juar, aplicando las condiciones usuales de frontera (13.1-17) y (13.1-18) en la unión, y la condición de frontera superficial en x =-d. En la situación que se está viendo, esto se puede escribir como

2 Obsérvese que la solución que se encontró en esta forma no es general, puesto que no contiene ninguna constante arbitraria. La solución general es la suma de la solución de la ecuación homogénea correspondiente (que contiene las dos constantes arbitrarias requeridas) y esta solución particular. 3. Por lo general, es más conveniente, por razones algebraicas, escribir la solución de la ecuación homogénea en términos de funciones exponenciales en una región infmita o semiinfmita y en términos de funciones hiperbólicas en una función de extensión finita.

El efecto fotovoltaico p-n y las celdas fotovoltaicas de unión p-n

np(O) npo

= Pn(O) = eeYo/kT

499

(15.1-9)

Pno

y

Dn (

d(n - n 0 )) P dx P -d = s · (np( -d)- np 0 ).

(15.1-10)

Siguiendo este procedimiento, puede demostrarse que (15.1-11)

~15.1-12)

y

s cos - + -

=

B

sen Ln Ln Ln d Dn A D d d __!! cos - + s sen Ln Ln Ln

1

dl + 1a.Notn ( - a. 2L 2

"

D

__!!

Ln

l

S+ a.Dn d cos -

Ln

(15.1-13)

d . + s sen -

Ln

La corriente de unión (15.1-14) se puede evaluar ahora para dar la ecuación de corriente-voltaje para el dispositivo. 4 El resultado se puede expresar en la forma (15.1-15) en donde

(15.1-16)

es una corriente de saturación que es una función sólo de los parámetros dimensionales y de material del dispositivo, independientes del nivel de iluminación y donde

_ ea.N 0 L!e-ad (_!___a.) ea.N 0 L! 1-a.2L2p L p +1-a.2L2n

lg-

{15.1-17)

4. Al hacer esto, es más sencillo dejar las expresiones para las concentraciones de portadores en exceso en la forma de (15.1-7) y (15.1-8), insertando las expresiones (15.1-11, 12 y 13) para las constantes arbitrarias, sólo al final.

500 Otros dispositivos semiconductores

Figura 1 5.4.

Relación corriente-voltaje de un dispositivo fotovoltaico p-n en diferentes intensidades de iluminación, indicando la construcción de la "línea de carga".

es una corriente de generac10n independiente del voltaje de umon V 0 ; pero directamente proporcional a la intensidad de iluminanción, según la representa N 0 . La corriente de generación (15.1-17) representa la parte de la corriente de electrones y huecos en exceso creados por la luz incidente que logra difundirse hasta la unión. Se puede demostrar fácilmente que la corriente de generación de huecos, tal como la representa el primer término de (15 .1-17), es siempre positiva, sean cuales fueren las magnitudes relativas de o:, L-p 1 y d; los detalles de esta demostración quedan como ejercicio para el lector. Demostrar que lo mismo puede decirse de la corriente de generación de electrones para la región p; es mucho más difícil pero, intuitivamente, debe ser evidente. Las relaciones corriente-voltaje dadas por (15.1-15) se ilustran en la figura 15.4, para varias intensidades de luz incidente. Se puede ver inmediatamente que si N 0 =O, la relación corriente-voltaje es la de un diodo ideal p-n mientras que cuando N 0 aumenta, la corriente de generación se incrementa proporcionalmente, dando origen a la familia de curvas que se muestra en el diagrama. También se ilustra una. "línea de carga" correspondiente a un valor dado de la resistencia del circuito; esto establece un punto de operación correspondiente a un voltaje de salida VP y una densidad de corriente de salida lp. Por supuesto, si la resistencia del circuito es infmita, correspondiendo a las condiciones de circuito abierto, I se desvanece y, de acuerdo con (15 .1-15), el voltaje del circuito abierto es Voc

= -kT In ( l + -lg) . e 1

(15.1-18)

0

Este es el voltaje máximo que se puede obtener del dispositivo en un nivel dado de iluminación. Como lo indica (15.1-18), el voltaje de circuito abierto aumenta logarítmicamente con lg (y, por tanto, con la intensidad de la iluminación), cuando lg ~ 10 • De acuerdo con la figura 15.2, se puede ver claramente que el voltaje máximo de circuito abierto que se puede obtener es del orden del potencial interno t/Jo. Si la resistencia del circuito (incluyendo la resistencia interna del dispositivo mismo) es cero, entonces, V 0 se hace tan pequefio que puede desecharse y fluye una corriente máxima de cortocircuito, correspondiente a la densidad de corriente (15.1-19)

El efecto fotovoltaico p-n y las celdas fotovo/taicas de unión p-n

501

En ambos casos, la potencia dada al circuito externo, como la expresa el producto JV0 es cero. Como se vio antes, es evidente que la máxima potencia se entrega a un circuito externo en circunstancias que son intermedias entre los dos extremos, por ejemplo en condiciones tales como las que se obtienen en el punto P, en la figura 15.3. No es difícil determinar con precisión la resistencia del circuito que origina la máxima potencia de salida y esto se recomienda como ejercicio para el lector. De acuerdo con (15.1-15) y la figura 15.4, es evidente que mientras más grande es la corriente generada lg, tanto más grande es la potencia proporcionada al circuito externo y más alta la eficiencia de conversién de energía lumínica a energía eléctrica. Aunque la generación de corriente es, en todos los casos, directamente proporcional a la intensidad de la iluminación, existen otros factores que tienen un papel importante en la determinación de la magnitud de lg. De acuerdo con (15.1-17) -y esto se ve intuitivamente-, es obvio que los tiempos de vida largos (por tanto, grandes longitudes de difusión en las regiones n y p) ayudan a producir grandes valores de lg. Del mismo modo, es evidente que la recombinación superficial sólo puede reducir las corrientes de difusión que puedan fluir a través de la unión y, por ende, una reducción en la velocidad de recombinación superficial dará como resultado, invariablemente, un valor incrementado para la densidad de corriente generada. Además, la profundidad de la unión por debajo de la superficie iluminada es un factor crítico. Si la unión es demasiado profunda, toda la luz será absorbida lejos de su parte delantera y las corrientes de difusión tendrán que fluir una gran distancia y sufrir una reducción enorme, debido a la recombinación volumétrica, antes de llegar a la unión. Por otro lado, si es muy poco profundo, gran parte de la luz penetrará más allá de ella, antes de que pueda absorberse y, nuevamente, las corrientes de difusión tendrán que recorrer un largo trecho. La profundidad ideal es del orden de la distancia de decaimiento exponencial 1/cx asociada con la absorción de la luz incidente. Puesto que el voltaje máximo de circuito abierto que puede obtenerse bajo una iluminación intensa es del orden del potencial interno cf>o, es ventajoso utilizar niveles de impurificación relativamente grandes, tanto en la región n como en la p, para obtener el mayor valor posible para esta cantidad. Del mismo modo, puesto que no se producen portadores en exceso, cuando la banda prohibida de energía ~€ sobrepasa a la energía del fotón de la luz incidente, que gran parte de la energía de los fotones se pierde en el calentamiento del cristal, si ~€ es mucho menor que la energía del fotón incidente, la máxima eficiencia de conversión de energía se obtiene cuando ~€ = he/A. Toda la exposición anterior se ha basado en una situación en la que la celda fotovoltaica se ilumina con radiación monocromática. En la mayoría de las aplicacioqes actuales de este tipo de dispositivos, la fuente lumínica es la luz solar que, por supuesto, tiene un amplio espectro continuo de longitudes de ondas. En este caso, es necesario calcular la distribución espacial real de la generación de porta.dores en exceso, lo cual ya no será la función exponencial simple (15 .1-3 ), sino una superposición de muchas funciones exponenciales de esta naturaleza, que representan muchas longitudes de onda, cada una de las cuales tiene un coeficiente de absorción característico cx(A.) que se obtiene del espectro óptico de absorción observado del cristal semiconductor, y cada uno tiene un factor característico de intensidad N 0 (A.), de acuerdo con la longitud espectral de la luz solar a cada longitud de onda. Entonces, g'(x) se representaría idealmente como una integral de la cantidad cx(A.)N0 (A. )e -•<x +dl sobre la longitud de onda y las ecuaciones de continuidad se convertirían en ecuaciones integrales que, en este caso, no todas admiten una solución analítica. La única alternativa posible es seguir usando técnicas numéricas y esto, evidentemente, está fuera del alcance de este trabajo para lograr algún progreso en esta dirección. No obstante, se debe hacer notar que la validez general de los

502 Otros dispositivos semiconductores resultados obtenidos en el caso monocromático se extienden, aun en esta situación más compleja. Por ejemplo, es muy conveniente usar un semiconductor en el que tl.e sea lo más parecido posible a la energía de fotón, a la longitud de onda de la máxima intensidad espectral y ubicar la unión a una profundidad que corresponda a la profundidad de absorción media de la longitud de onda de la máxima intensidad espectral. La energía de fotón asociada con la máxima intensidad espectral a la luz del sol es aproximadamente 2 eV. Desafortunadamente, los semiconductores que tienen este valor de tl.e y que existen en la actualidad (GaP, SiC, etc.) son muy poco satisfactorios para lograr que las celdas fotovoltaicas sean eficientes, debido a los tiempos de vida excesivamente cortos de los portadores en exceso que, invariablemente, se asocian con ellos. La banda prohibida de energía del germanio es demasiado baja para obtener una eficiencia óptima y, además, los voltajes de salida que se obtienen son también muy bajos. Las mejores celdas fotovoltaicas para iluminación solar, que se han obtenido hasta la fecha, se han fabricado de silicio; aunque el arseniuro de galio se ha utilizado con cierto éxito. Los mejores dispositivos fotovoltaicos de silicio pueden convertir un 1S por ciento de la radiación solar incidente en energía eléctrica, dando voltajes de salida de 0.55 a 0.6 V y densidades de corriente de, aproximadamente, 45 ma por cm 2 • Estos dispositivos se utilizan en grandes cantidades como fuentes de energía primaria para sistemas de potencia de los satélites.

15.2 OTROS DISPOSITIVOS SENSIBLES A LA LUZ: FOTOTRANSISTORES, DETECTORES DE PARTICULAS Y DETECTORES INFRARROJOS Además de las celdas fotovoltaicas p-n, que se vieron detalladamente en la sección anterior, existen muchos otros tipos de dispositivos, que funcionan basándose en la generación de pares de portadores en exceso por medio de una excitación óptica o de partículas elementales. Las celdas fotoconductivas se basan en el incremento de la fotoconductividad de cd, bajo una iluminación, con el fin de proporcionar una señal eléctrica proporcional a la intensidad de la radiación de excitación. El funcionamiento de los dispositivos de esta naturaleza se analizó ya en forma bastante detallada en la sección 10.6. Las celdas fotoconductivas de sulfuro de cadmio tienen un uso muy difundido como elementos sensores en cámaras y medidores de exposición fotográfica. Las celdas fotoconductivas en las que la ionización de niveles donadores profundos, a bajas temperaturas, por medio de una radiación incidente, da origen a la fotoconductividad, se usan muy a menudo como detectores infrarrojos. El germanio impurificado con oro se usa con mucha frecuencia con este fin. El transistor de unión en el que se introduce un exceso de pares electrónhueco en la región de base, mediante una excitación óptica, en lugar de utilizar un emisor de unión p-n, se conoce con el nombre de fototransistor. En la figura 15.5 se ilustra este dispositivo. En el fototransistor, el exceso de pares electrón-hueco creados por la luz incidente, se difunden y recogen mediante la unión de colector con polarización inversa. En efecto, los portadores en exceso generados por la luz contribuyen a la corriente de saturación térmica de la unión de colector. El fototransistor es capaz de mayor sensibilidad como detector de radiaciones que la celda fotovoltaica o las celdas fotoconductivas y, mediante un diseño y un funcionamiento adecuados, puede operar con gran eficiencia para detectar señales de luz a niveles

Rectificadores controlados p-n-p-n

503

''Región de la base"

n

Al amplificador u otro detector

Conector junction

+

-

'-------;1,11---~

Figura 15.5.

Diagrama esquemático del fototransistor o detector de radiación.

muy bajos. Puesto que los pares de electrón-hueco pueden producirse mediante haces incidentes de rayos X, rayos r, y otras partículas elementales, tales como electrones, protones o partículas a:, al igual que la luz, los dispositivos que tienen esta estructura funcionan admirablemente como detectores de partículas nucleares. Puesto que se crea un número muy grande de pares electrón-hueco cuando una partícula nuclear con una energía de varios MeV se detiene dentro de un cristal de silicio o germanio (el número se puede calcular, aproximadamente, observando que se obtiene un par electrón-hueco por cada tres eV de energía inicial de partícula, tanto en el silicio como en el germanio), la detección de una sola partícula nuclear se logra con suma facilidad. La magnitud del pulso de corriente resultante es más o menos proporcional a la energía de la partícula incidente, que permite la determinación de los espectros de energía, mediante el análisis de la altura de los pulsos.

15.3

RECTIFICADORES CONTROLADOS p-n-p-n

El rectificador de avalancha controlada p-n-p-n es una estructura de cuatro capas, como se descri~ .en la figura 15.6. Por lo general, está discfiado con densidades de impurezas mucho más fuertes en las capas externas que en las internas y, por tanto, podría identificarse más correctamente como un dispositivo p+-n-p-n.... El rectificador controlado p-n-p-n se puede considerar como dos transistores, uno p+-n-p y otro n-p-n+, con una unión de colector común, como se ilustra. La unión Sección p+-n-p e

•1

•z

n

+

• ...=.. I 01 =I. 2 =Ic

Carga Sección n·p-n+

Figura 15.6.

Diagrama esquemático de un dispositivo de conmutación de cuatro capas p·n·p·n.

504

Otros dispositivos semiconductores

e 1 es la unión de emisor de la sección p+-n-p, en tanto que e2 es el emisor de la sección n-p-n+. La unión e es una unión de colector común a ambas secciones.

Cuando se aplica un voltaje de alimentación, como se indica, se tendrá una unión con polarización inversa en d dispositivo. Si a 1 es la ganancia de corriente de la sección p+-n-p y a2 es la ganancia de corriente de la sección n-p-n+, entonces, utilizando la misma línea de razonamiento que se aplicó al caso de la autoamplificación de base abierta de la corriente de colector para un transistor p-n-p en las ecuaciones (13.6-50) y ( 13.6-51 ), se puede escribir (15.3-1) en donde

feo

es la corriente de saturación del colector. Sin embargo, puesto que (15.3-2)

la ecuación (15.3-1) se puede expresar en la forma (15.3-3) Ya se vio que, de acuerdo con las suposiCIOnes que se hicieron en la seccwn 13.6, la ganancia de corriente de un transistor de unión debe ser independiente de la corriente de emisor, excepto a valores grandes de ésta, en donde debe decrecer, debido a la reducción de la eficiencia de inyección a altos niveles de corriente. No obstante, la ganancia de corriente varía con la corriente de emisor, también a niveles de corriente muy bajos; se eleva a partir de un valor bastante bajo en le = O, con gran rapidez, hasta que se obtiene el valor predicho por (13 .6-31), y luego se hace prácticamente independiente de 1e, hasta que se establece la reducción a una densidad de corriente elevada, debido a la degradación de la eficiencia de inyección. Este estado de cosas, que se ilustra en la figura 15.7, se debe, en parte, a los efectos de fuga de superficie en la unión, o bien, a la recombinación dentro de la región de carga espacial de la unión. En todo caso, al aumentar el voltaje de fuente, la corriente de colector permanece casi constante a un valor pequeño, que es el que da (15.3-3), en donde a 1 y a 2 se refieren a los valores de estas ganancias de corriente en algún punto de la región de baja corriente (!
Rectificadores controlados p-n-p-n

SOS

Ganancia de corriente

1<:: Punto-J. de 1lop

Punto de encendido

Figura 1S. 7.

operación del estado "on"

Ganancias de corriente a¡ y a2 de las dos secciones de transistor de un dispositivo de conmutación de cuatro capas trazado en función de la corriente.

ganancia de corriente con la corriente de emisor, en la región de alta corriente, la suma de a 1 y a 2 vuelve a descender a la unidad; este punto se identifica como Iop en la figura 15.7. El dispositivo sigue en el modo de alta corriente hasta que se interrumpe el voltaje de alimentación, momento en el que (después de un corto tiempo de recuperación, del orden del tiempo de vida de los portadores en exceso dentro de las regiones internas) se reanuda una vez más, el modo de corriente baja. La acción de conmutación se puede iniciar no sólo con el principio de la ruptura de avalancha, sino también inyectando un pequeño pulso de corriente (de la magnitud suficiente para incrementar la corriente de colector hasta el punto en el que a 1 + a 2 sobrepasa a la unidad) a un "electrodo de compuerta" conectado a una de las regiones internas. De esta manera, el dispositivo se puede conmutar a voluntad. Las características de corriente-voltaje de un rectificador controlado p +-n-p-n + se ilustran esquemáticamente en la figura 15.8. Los dispositivos de este tipo, hechos de silicio, pueden soportar voltajes hasta de casi 1000 V en el modo de alta impedancia, y portar corriente de carga de varios cientos de amperes, en el estado de baja impedancia. En las dos regiones internas del dispositivo, las concentraciones de

1

, '

compuerta = O

11

compuerta> O

'V 1

~~·~--~-~-==~~~~~~============-/ Figura 1 S.S.

Relación corriente-voltaje dr un interruptor de cuatro capas.

506

Otros dispositivos semiconductores

portadores en exceso son casi siempre mucho mayores que los valores de equilibrio a niveles de operación de la corriente de carga, y en este modo de operación, el dispositivo se parece mucho a un rectificador p-i-n, en el que el papel de la región i está desempeñado por las dos regiones internas. Los dispositivos de esta naturaleza han encontrado una aplicación tecnológica muy difundida como conmutadores, dis· positivos de control de potencia, inversores y convertidores de frecuencia.

15.4

DIODOS TUNEL

B diodo túnel es un dispositivo semiconductor que se hace en forma muy semejante al rectificador ordinario de aleación p-n, excepto que las dos regiones p y n tienen tantas impurezas como sea posible y el ciclo térmico asociado con el proceso de aleación se realiza con suma rapidez, para proporcionar poca o ninguna oportunidad de que se produzca una difusión de estado sólido de los átomos de impurezas donadoras de la región n a la p y viceversa. Así se logra una transición
1


Barrera para el efecto túnel - -......

"

Efecto túnel con electrones <en

tipo-p

------•vn (a) equilibrio fcp------...

\.. (b) Polarización inversa

fcp-----

Efecto túnel con electrones

(e) Pequeña polarización directa Figura 15.9.

(d) Polarización directa mayor

Diagramas de potencial, que ilustra el funcionamiento del diodo túnel.

Diodos túnel

501

muy abrupta del material p+ al n+, dentro del cristal y, en consecuencia, la región de carga espacial de la unión es muy angosta y da origen a campos eléctricos extremadamente grandes. Esto se ilustra mediante las cifras de la tabla 12.1 ; un diodo túnel típico puede tener densidades de impurificación de 10 18 ó 10 19 cm- 3 , tanto en la región p como en la n. En cristales en los que el contenido de impurezas es tan grande, la aproximación de Boltzmann ya no puede aplicarse, la distribución electrónica se degenera y el nivel de Fermi está, en realidad, dentro de la banda de conducción o de valencia, según que el semiconductor sea tipo n o p, respectivamente. Por tanto, el diagrama de las bandas de energía en equilibrio del diodo túnel es tal como se describe en la figura 15.9(a). En el diodo túnel es tan abrupta y la región de carga espacial tan delgada, que la barrera de energía potencial [que aparece en la figura 1S.9(b) ], que separa a los electrones de la banda de valencia de los estados de igual energía en la banda de conducción es lo suficientemente angosta, incluso en ausencia de una polarización inversa, que permite que se produzca la formación de un túnel cuántico de electrones a través de la barrera. En el estado de equilibrio, sin que se aplique ningún voltaje de polarización, la formación de túnel de los electrones procede con la misma probabilidad en ambas direcciones, de manera que no se tiene un flujo neto de corriente. Si se aplica un voltaje de polarización inversa, como en (b) de la figura 15.9, las distribuciones electrónicas a ambos lados están desplazadas verticalmente la una con respecto a la otra, en una cantidad igual al voltaje de polarización. En esta condición, los estados vacíos del lado n están frente a los estado llenos del lado p y los electrones de estos estados forman un túnel a través de la barrera potencial para proporcionar grandes corrientes netas. El dispositivo no soporta ningún voltaje en absoluto en la dirección inversa; pero puede considerarse que sufre una ruptura mediante el mecanismo de Zener a valores infinitesimalmente pequeños de voltaje aplicado. En sentido directo, la corriente de túnel comienza a fluir al principio por este mismo mecanismo, como se indica en (e) de la figura 15.9; pero, después de que el voltaje de polarización directa aumenta más allá de cierto punto, las bandas "se descruzan" como se muestra en (d) y, entonces, ya no hay más estados finales para la formación de túneles, de manera que la corriente de túnel desciende bruscamente. Al aplicar voltajes de polarización directa todavía mayores, la corriente normal de difusión directa o inyección asociada con cualquier rectificador p-n comienza a fluir sobre la barrera de potencial en una cantidad importante y la corriente vuelve a aumentar. El resultado de tales procesos sucesivos es una curva característica de corrientevoltaje, como la que se ilustra en la figura 15.10, con una región de resistencia negativa. La característica de resistencia negativa del dispositivo se puede utilizar para hacer que la unidad funcione como un amplificador, un oscilador o un dispositivo de conmutación. Puesto que el proceso de formación de túnel (en contraste con la difusión) es prácticamente instantáneo, los diodos túnel se pueden usar a frecuencias muy elevadas (h~sta 10.000 me, en la práctica) como amplificadores u osciladores. En los diodos túnel de germanio, la relación de las corrientes máxima a mínima puede ser hasta de 15, siendo las corrientes máximas de una fracción de miliampere, hasta posiblemente un ampere, que puede obtenerse a través de modificaciones apropiadas en el procedimiento de fabricación. Los diodos túnel se han fabricado de silicio y GaAs, con excelentes resultados. La densidad de corriente de túnel observada en el pico de la curva corriente-voltaje, depende enormemente de la densidad de impurezas en las regiones n y p del dispositivo. Con altas concentraciones de impurezas, la región de carga espacial es muy angosta, la barrera de túnel extremadamente delgada y la máxima densidad de la corriente de túnel puede ser

508

Otros dispositivos semiconductores !(mal 5

4

3

Región con "exceso de corriente" 2 /

, ~Corriente de difusión 01

Figura 15.10.

03

04

05

06

Relación corriente-voltaje de un diodo túnel típico (curva continua) en comparación con los valores predichos para las corrientes de túnel y difusión (curva' punteadas).

muy grande. En el germanio, con densidades de impurezas cercanas a 10 20 cm- 3 , se han observado densidades de corriente de túnel de casi 2000 amp cm- 2 • Con menores concentraciones de impurezas, se reduce la densidad de corriente de túnel y el efecto apenas puede observarse a niveles de impureza del orden de 10 18 cm- 3 . La corriente de túnel se puede calcular, a condición de que se conozcan las densidades de estados de la banda de conducción y valencia y la probabilidad de formación de túnel asociada con la barrera de potencial. Puesto que las razones de transición entre los estados inicial "Y final son proporcionales a la densidad de los estados iniciales y la densidad de los estados finales, se puede escribir la siguiente expresión para la corriente de túnel de la banda de conducción a la de valencias (15.4-1)

mientras que la corriente de túnel, en dirección opuesta se puede escribir como sigue (15.4-2)

en esas ecuaciones, fc(e) y fv(e) son las funciones de distribución de energía electrónica en la banda de conducción en el lado n y la banda de valencia del lado p, respectivamente, Z es la probabilidad de formación de túnel asociada con la barrer¡;_ y A es una constante. La probabilidad de formación de túnel se puede obtener como el coeficiente de transmisión de la barrera de potencial para los electrones, S.

Véase el artículo original sobre el diodo túnel de L. Esaki, Phys. Rev., 109, 603 (1958).

Transistores de efecto de campo o unipolores

509

mediante la solución de un problema de barrera de la mecánica cuántica similar al que se vio en la sección 9.11, en conexión con la dispersión reticular de modo acústico. El total de la corriente neta de túnel es la suma de las dos corrientes dadas por (15.4-1) y (15.4-2), o sea, (15.4-3)

En la condición de equilibrio y sin aplicar ningún Voltaje,/c(e) =fv(e) y (15.4-3) se reduce a lt =O, como se requiere. La característica observada de corriente-voltaje para un diodo túnel típico de germanio es la que aparece en la figura 15.1 O. La contribución de la corriente de túnel, como lo indica (15.4-3) y la componente ordinaria de la corriente de difusión, en sentido directo, como la da (13.1-23), están representadas por las curvas punteadas. La suma de estas dos corrientes reproduce muy bien la corriente observada en la región del túnel y la región de voltajes directos grandes; pero cerca de la corriente mínima, la densidad de corriente observada es invariablemente mucho mayor que lo que predice la simple teoría que se explicó antes. Esta "corriente en exceso" cercana al mínimo, se ha adjudicado a la presencia de niveles de energía en la región prohibida (debido al atrapamiento de impurezas o imperfecciones estructurales), y a una modificación de la densidad actual de la curva de estados en las bandas de conducción y valencia, mediante la introducción de impurezas donadoras y receptoras, en concentraciones tan grandes que los estados donadores y receptores forman bandas de niveles que pueden ser lo suficientemente anchas en las circunstancias reinantes, para superponer las bandas de conducción y valencia. 6

15.5

TRANSISTORES DE EFECTO DE CAMPO O UNIPOLARES

En el transistor de efecto de campo (o transistor unipolar), se puede lograr la amplificación de un voltaje de entrada, aplicando la señal a un electrodo que controla la anchura de un canal angosto que porta corriente, haciendo variar la anchura de la regíón de carga espacial asociada con una unión p-n, como se indica en la figura 15.11. En general, una corriente de carga (denominada a veces corriente de fuente) debe fluir a través de un canal angosto que está unido a un lado, por lo

Regi6n-p (muy impurificada)

Polarizaci6n +

Figura 15.11. 6.

= Diagrama esquemático de un transistor de efecto de campo y sus circuitos asociados.

Véase T. P. Brody, J. Appl. Phys., 32, 746 (1961).

510

Otros dispositivos semiconductores

menos, con la región de carga espacial relacionada con una umon p-n. Conforme varía el voltaje inverso de esta unión, la extensión de la región de carga espacial y, por tanto, la conductancia del canal, varía en forma correspondiente. La terminal de entrada de corriente del canal de un transistor de efecto de campo se denomina casi siempre electrodo de fuente, la terminal de retorno del canal es el electrodo de drenaje y la terminal de entrada de señal es el electrodo de compuerta. Aunque no se dará aquí un análisis completo del comportamiento de estos dispositivos, 7 conviene señalar que sus características eléctricas son bastante análogas a las del pentodo común al alto vacío. 8 Tanto el transistor de efecto de campo como el diodo túnel son dispositivos algo especiales entre los semiconductores, en el sentido de que no dependen de la inyección o el transporte de portadores minoritarios para poder funcionar; más bien utilizan esencialmente sólo el transporte de portadores mayoritarios para efectuar la función que se requiere del dispositivo. Este estudio de los dispositivos semiconductores no es, de ninguna manera, lo suficientemente general; pero ha incluido sólo algunos de los ejemplos más importantes y algunos otros cuya operación ilustra fenómenos físicos importar1tes que ponen en claro técnicas analíticas de aplicabilidad general. Un estudio sistemático de los numerosos dispositivos semiconductores que usa la tecnología actual es imposible de realizar en un trabajo del alcance de esta obra. Estos dispositivos incluyen detectores de microondas, hlsers de unión p-n, termistores, multiplicadores análogos y probadores para medición de éampo magnético que utlizan el efecto de Hall, refrigeradores termoeléctricos y generadores de potencia, así como varios tipos de módulos de "circuitos integrados". Es de esperarse que los ejemplos que se han visto detalladamente en este capítulo, proporcionen los conocimientos suficientes del comportamiento de las uniones p-n y que las técnicas matemáticas incluidas, que se requieren para el análisis de los dispositivos semiconductores, le permitan al lector proceder independientemente en el estudio de otras obras. En la lista de referencias que aparece al fmal de este capítulo se podrán encontrar mayores detalles relacionados con los dispositivos que se vieron aquí, así como material relacionado con otros semiconductores.

EJERCICIOS l. Verifique algebraicamente que las expresiones (15.1-15), (15.1-16) y (15.1-17) obtenidas de los resultados anteriores, llenando los detalles formales de la derivación de estas ecuaciones. 2. Demuestre que la corriente de generación de huecos en una celda fotovoltaica p-n, tal como la indica el primer término de la ecuación (15.1-17), es siempre positiva, sean cuales fueren las magnitudes relativas de a, Lji 1 y d. 3. ¿A qué valor de voltaje de salida se obtiene la máxima salida de potencia de una celda fotovoltaica p-n? ¿Cuál es el valor de la resistencia de circuito que se requiere para obtener esta máxima potencia de salida? 4. En la unión p-n del fototransistor de la figura 15.5 se mantiene un voltaje de polarización inversa de - 100 V. Un electrón con una energía de 500 keV choca con la superficie frontal del dispositivo y su energía se ve absorbida totalmente dentro de la región de carga espacial asociada con la unión. Suponiendo que se disipan, en promedio, 3 eV de energía de la partícula incidente por cada par electrón-hueco, y que todos los pares electrón-hueco se crean instantáneamente, encuentre la magnitud del pulso de corriente que se observa en el circuito externo. 5. De acuerdo con la figura 15.2, resulta evidente que el máximo voltaje de circuito abierto que se obtiene en una celda fotovoltaica p-n, es 1/Jo. Sin embargo, de acuerdo con la ecuación (15.1-18), el voltaje de circuito abierto puede ser arbitrariamente grande, a condición de que la intensidad de la luz (y, por ende, lg) sea lo suficientemente grande. ¿Cuál es la explicación de esta paradoja aparente y cuál de los postulados es el correcto?

'·Un análisis de este tipo de dispositivo fue presentado por W. Shockley, Proc. I.R.E., 40, 1365 (1952). 8 Aunque es capaz de efectuar todas las funciones eléctricas normalmente asociadas con el triado al vacío, el comportamiento del circuito del transistor con·{m de unión difiere cualitativamente del tubo al vacío, debido a que depende de la presencia de dos especies de portadores, en lugar de uno. Por tanto, a veces se conoce con el nombre de dispositivo bipolar.

Transistores de efecto de campo o unipolares

511

LECTURAS RECOMENDADAS J. K. Jonscher, Principies of Semiconductor Device Operation, G. Bell and Sons, Ltd., Londres (1960). M. J. Morant, Introduction to Semiconductor Devices, Addison-Wesley Publishing Co., Reading, Mass. (1964). A. Nussbaum, Semiconductor Device Physics, Prentice-Hall, Inc., Englewood Cliffs, N. J. (1964). E. Spenke, Electronic Semiconductors, McGraw-Hill Book Co., Inc., Nueva York (1958). R. Wiesner, p-n Photoeffect, in Halbleiterprobleme, Friedrich Vieweg und Sohn, Braunschweig (1956), Vol. III, pp. 56-71. A. van der Ziel, Solid State Physical Electronics, Prentice-Hall, Inc., Englewood Cliffs, N. J. (1957) "Transistor Issues," Proc. inst. Radio Engrs., 30 (diciembre 1952) y 46 Gunio 1958).

CAPITUwl6 Contactos ~'~letal-semiconductor y superficies de semiconductores 16.1

CONTACTOS METAL-SEMICONDUCTOR EN EQUILIBRIO

Cuando dos metales que tienen diferentes funciones de trabajo entran en contacto, se produce un breve flujo de corriente transitoria que transmite electrones del metal con la mayor energía de Fermi, al que tiene una energía de Fermi menor, generando una diferencia de potencial de contacto en equilibrio entre ambos. Este proceso se ilustra esquemáticamente en la figura 16.1. En (a), dos metales que tienen diferentes funciones de trabajo, están separados por una distancia d, la cual se

-----

T

T

:-.;::

1



8z

8z

Efecto túnel

d

•,z

(a)

.! o""''""'

= =

1----:8¡

+

2 1

dol pote•d• :le contacto =z -.¡.,

~~~~

.,~~~~

(el Figura 16.1.

Etapas sucesivas para establecer el equilibrio entre dos metales con diferentes funciones de trabajo.

513

514

Contactos metal-semiconductor y superficies de semiconductores

considera bastante grande, posiblemente del orden de un centímetro. En estas circunstancias, los niveles de Fermi de los dos metales no coinciden y el sistema no está en equilibrio. Para lograr el equilibrio entre ambos metales, los electrones deben formar un túnel a través de la barrera de potencial del metal que tiene la energía de Fermi más alta al de energía más baja, hasta que se llegue a una condición de equilibrio en que coincidan los dos niveles de Fermi. Esto no se puede lograr en tanto que los metales estén muy separados, como sucede en (a), debido a que la barrera de potencial es tan alta y tan gruesa que la posibilidad de formar un túnel es casi nula. En estas condiciones, el equilibrio podría establecerse, sólo después del trancurso de millones de afios. Al irse acercando los dos metales, como se indica en (b ), el espesor de la barrera de túnel se hace cada vez menor, hasta que la probabilidad de la formación de túnel se hace suficientemente grande para permitir que los electrones penetren por la barrera y fluyan de izquierda a derecha en el diagrama. La separación física d, indispensable para producir esta situación, es unos cuantos múltiplos de la distancia interatómica. La corriente de electrones crea una carga negativa en el metal de la derecha y el exceso de iones positivos que quedan detrás, a la izquierda, da origen a una carga positiva en esa región. Así se establece un campo que eleva la energía potencial de los electrones de la derecha con respecto a los de la izquierda, hasta que coinciden los niveles de Fermi de los dos metales. En estas condiciones, el sistema está en equilibrio y la corriente neta de túnel desciende a cero, ya que, ahora, es igualmente probable el efecto de túnel en cualquiera de las dos direcciones. Sin embargo, la transferencia de electrones que fluían de izquierda a derecha ha establecido una diferencia de potencial de la magnitud cp 2 - cp 1 entre los dos metales. Este voltaje se denomina diferencia de potencial de contacto entre los dos metales. El número de electrones que se transfieren de un metal a otro, a fin de establecer esta diferencia de potencial, es tan pequeño, en comparación con el número total de electrones en las dos substancias, que los valores relativos de la población de electrones libres no se ve en realidad afectada. Se puede seguir la misma línea de razonamiento para inferir las propiedades de un contacto metal-semiconductor. No obstante, el semiconductor difiere de una substancia metálica en que puede existir un campo eléctrico en el interior de un semiconductor. Por esta razón, la caída de potencial de contacto entre el metal y el semiconductor puede producirse dentro del semiconductor, en lugar de hacerlo en la interfaz de contacto. En el caso más simple posible, lo que puede suceder se ilustra en la figura 16.2 para la situación de un contacto entre un metal y un cristal semiconductor tipo n, en donde la función de trabajo del metal,
Contactos metal-semiconductor en equilibrio

------

515

T

T

e.¡, ••

-=--=:k-

-

_,.

--.....1.--iEfM

~-------d--------~ Ev

+ +

++ + +

(a)

__..1-- Región desértica

(carga espacial 1 positiva)

1

Se forma una región de carga espacial

--- - --

1 1 1

-

--Ce ---l
d

•rf---------

(b) Figura 16.2.

(e)

Etapas sucesivas para establecer el equilibrio entre un semiconductor tipo n Y un metal que tiene una función de trabajo mayor.

En este ejemplo, la densidad neta de portadores cerca de la superficie del semiconductor se reduce de su valor de equilibrio volumétrico y la capa superficial se denomina región de deficiencia. Si M -1/>sc es lo bastante grande, las bandas pueden cambiarse con respecto al nivel de Fermi, a tal grado que, cerca de la superficie la banda de valencia está más próxima del nivel de Fermi que la de conducción, y el material inmediatamente adyacente a la superficie se convierte en tipo p. Se dice entonces que la superficie invierte su tipo de conductividad y la superficie de la región tipo p se llama región de inversión. Es importante observar que, en este ejemplo, se forma en la superficie una barrera de potencial con una altura e(M -1/>sc). La formación de esta barrera de potencial y la existencia de la región de deficiencia son la base para explicar cómo funciona un rectificador de contacto metal-semiconductor, como se verá más tarde. Se debe observar que, en general, la región de deficiencia es muy gruesa. En realidad, el espesor de la región de carga espacial de la superficie es prácticamente el mismo que la de una unión p-n, que tiene una diferencia de potencial interno M -1/>sc· Por tanto, no existe la posibilidad (excepto en circunstancias extremas) de que los electrones puedan establecer un túnel a través de dicha barrera. Por otro lado, se puede considerar que la barrera delgada, con un espesor d, como se ilustra en las figuras 16.1(c), 16.2(c) y 16.3 es, finalmente, tan delgada que permite que los electrones se desplacen libremente, formando un túnel a través de ella. Fn dos

516

Contactos metal-semiconductor y superficies de semiconductores Carga espacial

1--+--+ 1-positiva

.-1--- Región desértica 1 (tipo-n) -

1 1

__ ¡--

Región de inversión (tipo-p)

·~---+-··

Figura 16.3.

Capa de inversión en la interfaz entre un metal y un semiconductor tipo n.

J

Se forma una .------,región de carga espacial negativa

Región de acumulación de n+ e(<#IM-+sc) (Carga ,espacial negativa)

e<#lsc

-

-

-1

-

----- -.-

~~~;_~~L--~

-d-

1-+:-----+.....--+:-- ••

(al Figura 16.4.

(b)

Etapas sucesivas para establecer el equilibrio entre un semiconductor tipo n y un metal que tiene una función de trabajo menor.

materiales que están unidos en contacto íntimo, d es cero y la única barrera que permanece es la barrera de potencial superficial del semiconductor. En la figura 16.4 se muestra la situación que se produce en la interfaz de contacto entre un metal y un semiconductor tipo n, en donde t/Jsc es mayor que tPM· En este caso, el semiconductor debe adquirir una carga negativa, el metal una positiva y las bandas se desplazan hacia abajo en la superficie. Como resultado, en lugar de tener una barrera de potencial, se forma una región de acumulación en la que la concentración de electrones es mayor que la de los átomos donadores ionizados. Fl exceso de concentración electrónica en la región de acumulación superficial crea la carga espacial negativa necesaria para sostener la diferencia de potencial de contacto entre las dos substancias. Los efectos de contacto que se originan entre los metales y los semiconductores tipo p pueden verse más o menos en la misma forma que los de los metales con los semiconductores tipo n. Por tanto, se puede demostrar que se forma una región de deficiencia o inversión, con la barrera de potencial correspondiente, en la interfaz entre el semiconductor tipo p y un metal cuya

Rectificación por contacto metal-semiconductor

S17

función de trabajo es menor que la del semiconductor, y se establece una capa de acumulación entre el semiconductor tipo p y un metal que tiene una función de trabajo mayor. La verificación de estas conclusiones queda como ejercicio para el lector.

16.2

RECTIFICACION POR CONTACTO METAL-SEMICONDUCTOR

La barrera de potencial en una interfaz metal-semiconductor en donde está presente una capa de deficiencia o inversión, se comporta como un rectificador, más o menos en la misma forma en que lo hace una unión p-n en el interior de un c.ristal semiconductor. Puesto que la concentración de portadores dentro de la región de deficiencia es menor que la de otras partes del sistema, cualquier voltaje aplicado externamente tenderá a aparecer principalmente en la capa de mayor resistividad. El voltaje aplicado tenderá a aumentar o reducir la altura de la barrera efectiva, como se indica en la figura 16.5 para el caso de un semiconductor tipo n y un metal con una función de trabajo mayor. En (a), en estado de equilibrio, cierta fracción de los electrones de la banda de conducción del semiconductor, tendrán la suficiente energía para sobrepasar la barrera de potencial de la superficie. Estos electrones harán que fluya hacia la izquierda una corriente electrónica J;;. También se tendrá un flujo hacia la derecha del metal al semiconductor, compuesto de electrones Ji,, debido a la pequeña

.,~

+

••

Semiconductor {tipo-n)

Metal

---....,.+--··

(a) Equilibrio 4----f----Jn

(b) Polarización inversa (V0<0)

- -

---..;;;,._,.;;;__;::,-___;-:;...

+

..

++ + ++ >:::-:::--....,..-~.,..-,..--++ + + + + + •• Jp+---+-Jp-

'

Huecos inyectados

(e) Polarización directa (V0 >0) Figuras 16.5.

Diagramas de potencial que ilustran la operación de un contacto rectificador metal-semiconductor: (a) en estado de equilibrio, (b) con polarización inversa y (e) con polarización directa.

518

Contactos metal-semiconductor y superficies de semiconductores

fracción de electrones del metal que pueden sobrepasar la barrera. De acuerdo con el principio del balance detallado, estos dos flujos deben ser iguales en magnitud en estado de equilibrio; en estas circunstancias, no se tiene una corriente neta de electrones. De la misma manera, se tienen dos flujos de huecos 1; y 1;. El primero se compone de huecos que se generan en la superficie del semiconductor (por electrones de la banda de valencia que ocupan estados electrónicos ocasionalmente vacíos en la distribución electrónica del metal) y que tienen la suficiente energía para sobrepasar la barrera de potencial y entrar al semiconductor. La segunda consiste en huecos del interior del semiconductor que se difunden a la superficie y desaparecen ahí al extraer un electrón de la distribución de Fermi del metal. Nuevamente en equilibrio, estos dos flujos son iguales y opuestos y no se tiene un flujo de corriente de huecos. Cuando se aplica un voltaje externo al contacto, se crea la situación que se ilustra en la figura 16.5(b) o (e). Evidentemente, los dos flujos Jr¡ y Jt están regidos por el número de portadores presentes en el semiconductor, y que poseen la suficiente energía para sobrepasar la barrera de potencial superficial que, cuando se aplica un voltaje externo. tiene la altura, e(cp 0 - V0 ), en donde, (16.2-1)

es la diferencia entre las funciones de trabaio. Este número es proporcional a Los otros dos flujos J¡; y J! sólo dependen, respectivamente, del número de huecos térmicamente generados que haya en el interior del semiconductor, y de la cantidad de electrones del metal que viniendo desde la izquierda puedan sobrepasar la barrera (en donde la altura de ésta es fija). Estos dos flujos son funciones sólo de la temperatura y los parámetros del material de las dos substancias, e independientes de la altura de la barrera e(cp 0 - V0 ). Por tanto, J;; y se puede expresar en la siguiente forma: e-e(.Po- Vo)/kT

.r;

(16.2-2)

y J p+ = J pO e-e(t/>o-Vo)fkT '

(16.2-3)

en donde lno y lpo son constantes que expresan los flujos de electrones y huecos de cualquier energía que sea, que inicialmente son incidentes en equilibrio sobre la barrera superficial. Puesto que Jt, y JP deben ser iguales a - Jr¡ y - 1¡, respectivamente, cuando no se aplica ningún voltaje, estos flujos se pueden representar como (16.2-4) y

¡= -J e-et/>o/kT D DO

(16.2-5)

Entonces, los flujos totales de electrones y huecos son (16.2-6) y J

P

= ¡+P + ¡-P = J pO e-etf>o/kT(eeVo/kT _

1)

'

(16.2-7)

Rectificación por contacto metal-semiconductor

519

en tanto que la densidad total de corriente eléctrica es, sencillamente, 1 = e(JP- Jn)

= lo(eeYo/kT-

1),

(16.2-8)

en donde (16.2-9)

En consecuencia, el rectificador metal-semiconductor tiene la misma dependencia corriente-voltaje que la unión p-n, excepto que la corriente de saturación es distinta. Los grandes flujos de electrones y huecos, que se acercan a la barrera en equilibrio de la derecha y la izquierda, respectivamente, se pueden expresar 1 como (16.2-10) y

J

_ po¡-

e~o/kT -4e'

Pi: _ PoC

(16.2-11)

en donde Ps se relaciona con la concentración de huecos en la banda de valencia en la superficie metálica. Utilizando estos resultados, la corriente de saturacióa se puede representar ahora en la forma siguiente (16.2-12)

En la condición de polarización inversa, el flujo de corriente es pequeño, aproximándose a 10 a voltajes inversos grandes, en comparación con kTje. En estas circunstancias, la región de deficiencia aumenta de espesor, al incrementarse la polarización inversa, como sucede también con la región de carga espacial de una unión p-n. Los procesos físicos que controlan el espesor de la capa de deficiencia son esencialmente los mismos en ambos casos. La corriente que fluye se compone casi por completo de huecos "recolectados" del interior del semiconductor por medio de los contactos y los pocos electrones del metal que logran sobrepasar la barrera desde la izquierda en la figura 16.5(b). En la condición de polarización directa, la altura de la barrera se reduce y el número de electrones de la banda de conducción que pueden sobrepasar la barrera, es ahora mucho mayor que en equilibrio o en condiciones de polarización inversa. También se produce un gran flujo de electrones del semiconductor al metal. Además de este flujo de electrones, se observa un flujo de huecos hacia el interior del semiconductor, debido a que ahora la barrera de potencial para los huecos que se generan en la superficie se reduce también cuando los electrones de la banda de valencia del semiconductor caen dentro de los estados electrónicos vacíos de la distribución de Fermi del metal. Esto equivale sencillamente 1 Debe observarse al respecto, que no puede haber campos ni gradientes de concentración, así como tampoco la generación y recombinación de electrones y huecos como tales, en el metal y, por esta razón, la situación difiere en ciertos aspectos esenciales de la que se vio en la sección 13.1 en conexión con la unión p-n. De igual manera, es correcto usar las expresiones (16.2-10) y (16.2-11) sólo cuando la región de deficiencia es lo bastante delgada para que no se produzca dentro de ella prácticamente ninguna difusión. Puesto que el espesor de la barrera superficial es, por lo común, más o menos lo mismo que las trayectorias libres medias de electrones y huecos, a veces no se puede satisfacer esta condición en la práctica.

520 Contoctos metal-semiconductor y superficies de semiconductores a la inyección de portadores minoritarios que se debe al contacto metálico en la condición de polarización directa. Los cálculos anteriores se hicieron para el caso de un contacto entre un semiconductor tipo n y un metal, que tiene una función de trabajo mayor. El caso de un semiconductor p y un metal que tiene una función de trabajo menor, se puede efectuar prácticamente del mismo modo. Sin emb~, -en este caso, veremos que se obtiene una rectificación en sentido directo cuando el semiconductor es positivo con respecto al metal, que es justamente lo opuesto del resultado antes obtenido. En estas condiciones, se inyectan electrones al semiconductor tipo p, cuando éste es positivo con respecto al metal. La verificación de estos resultados queda asignada como ejercicio. Debido a la ausencia de una barrera de potencial, no se obtiene una rectificación en un contacto en el que se forma una capa de acumulación. Por tanto, se obtendrá un contacto esencialmente óhmico en la interfaz, en donde no hay barrera (es decir tPM = tf>sd o en donde está presente una capa de acumulación. Los resultados antes obtenidos sirven para verificar las observaciones sobre las propiedades de los rectificadores de puntas de contacto que se hicieron en relación con el estudio del experimento Haynes-Shockley en la sección 10.4. Las predicciones de esta teoría de los contactos metal-semiconductor desafortunadamente no están totalmente de acuerdo en todo con la experiencia. 2 En particular, estos cálculos indican que las propiedades de rectificación de los contactos metal-semiconductor deben ser extremadamente sen!t.ibles a la diferencia de las funciones de trabajo entre uno y otro, mientras que se encontró que son casi independientes de esta cantidad. Bardeen 3 explicó esta discrepancia en 1947, e introdujo la idea de los estados de superficie en la interfaz del contacto. Este tema se estudiará en la siguiente sección. En otros aspectos, la teoría fue más útil ya que la característica predicha de corriente-voltaje concuerda bastante bien con la experiencia y, en particular, los efectos asociados con la inyección de electrones y huecos (como se ilustra, por ejemplo, mediante el experimento de Haynes-Shockley) están totalmente de acuerdo con las observaciones experimentales.

16.3

ESTADOS SUPERFICIALES Y RECTIFICACION INDEPENDIENTE DE LAS FUNCIONES DE TRABAJO

De acuerdo con los resultados obtenidos de la seccwn anterior, las características de los contactos rectificadores metal-semiconductor deben depender básicamente de la diferencia en las funciones de trabajo del semiconductor y el metal. En particular, si las funciones de trabajo de dos substancias son tales que producen una capa de acumulación, no se podrá esperar la rectificación. Por el contrario, los resultados experimentales de Meyerhof, 2 demostraron que, en el caso de los contactos de silicio-metal, •las propiedades de rectificación del contacto son prácticamente independientes de la diferencia de las funciones de trabajo y, en realidad, era más o menos lo mismo para todos los metales. Bardeen3 resolvió esta situación, al suponer que podía haber estados electrónicos localizados asociados con la superfrcie que quedaba dentro de la rel!ión de energía prohibida entre las bandas de conducción y valencia del semiconductor. La justificación fundamental de-la existencia de estos estados de superficie se relaciona con el trabajo de Tamm4 , quien demostró que, si un potencial periódico 2

3 4

Véase, por ejemplo, W. E. Meyerhof, Phys. Rev., 71, 727 (1947). J. Bardeen, Phys. Rev., 71, 717 (1947). l. Tamm, Physik. Z. Sowjetunion, 1, 733 (1932).

Estados superficioles y rectificación independiente

Barrera de superficie Figura 16.6.

S21

-x

La formación de los estados Tamm localizados dentro de la región de energía prohibida en la superficie de un cristal unidimensional.

de pozo cuadrado, como el relacionado con el modelo de cristal de Kronig-Penney, quedara cortado en un lado mediante una barrera de potencial superficial, como el que se ilustra en la figura 16.6, se tendrían (además de las bandas de energía permisibles acostumbradas del modelo de Kronig-Penney), niveles discretos permisibles, dentro de las regiones de energía prohibida, correspondientes a las funciones de onda que se localizan cerca de la superficie. Shockley 5 estudió más tarde y de manera más detallada estos niveles de superficie. De acuerdo con los cálculos, debe haber un estado de superficie por cada átomo superficial. Además de esto, se puede esperar que se produzcan niveles de superficie localizados, con una distribución discreta o continua, debido a los átomos de impurezas, capas de óxidos e imperfecciones estructurales en la superficie. Las propiedades superficiales de un cristal individual dependerán de la densidad de estos niveles superficiales y su distribución de energía. La presencia de una densidad considerable de estados superficiales dará como resultado una capa superficial de deficiencia o una capa de acumulación dentro del semiconductor, incluso en ausencia de un contacto metálico externo. Para entender cómo se llega a esto, se deberá examinar detalladamente un modelo específico que se compone de un cristal semiconductor tipo n que tiene un número substancial de estados superficiales de tipo receptor (que se cargan cuando están ocupados y son neutros cuando están vacíos), cuya densidad y distribución de energía dentro de la región prohibida se ilustra en la figura 16.7. En ausencia de cualquier contacto metálico en la superficie, los estados superficiales se llenarán hasta el nivel de Fermi6 creando una capa de carga negativa en la superficie, que repele los electrones dentro de la banda de conducción del semiconductor, desde la superficie y que, por tanto, deja una capa de carga espacial positiva superficial, debida a los iones donadores no compensados. De esta manera, se establece una región de deficiencia y una barrera de potencial superficial mediante el equilibrio entre el semiconductor volumétrico y los estados superficiales, de un modo muy independiente de cualquier contacto externo. Si el cristal, tomado como un todo, es eléctricamente neutro, la carga total contenida dentro de la región de carga espacial del semiconductor debe tener la misma magnitud que la carga total asociada con los electrones en los estados superficiales. Como se verá más tarde, este hecho permite calcular el valor del potencial superficial <J>s dentro del semiconductor, en un punto adyacente a la superficie y, de hecho, toda la distribución de potencial dentro de la capa superficial del semicons W. Shocldey, Phys. Rev., 56, 317 (1939). 6 Por supuesto, esta proposición se relaciona con las condiciones que prevalencen al cero absoluto. A temperaturas más altas, algunos estados anteriores a El estarán ocupados y algunos estados inferiores estarán vacíos, de acuerdo con la ley de distribuc10n de Fermi.

522

Contactos metal-semiconductor y superficies de semiconductores Densidad del estado superficial

Región de carga -j espacial positiva 1 1 1

1 1 1

- - --------'¡...;-.,_.;;:---.-.:--..:=:..;-=-:-=--::....::-::.;..;--.::.-.... -=.:.,;;-;:.-....-,.;;-;;.-....:-=---•c(X l

----------

Electrones en los niveles superficiales (carga superficial negativa)

~-¡+-;---.+:.-----+:----:+---+-:- «r(x)

Punto intrínseco

-x

x•O

Figura 16.7.

Formación de una capa superficial de inversión en una superficie libre de un semiconductor a través de la interacción de los estados superficiales con el interior del cristal.

ductor. Es evidente que si los estados superficiales son principalmente de tipo donador (cargados cuando están vacíos y neutros cuando están ocupados por electrones), se formará una capa de acumulación y no una de deficiencia en un cristal tipo n. Para comprender el efecto preciso de los estados superficiales; se verán ahora los efectos que se producen cuando una substancia metálica se acerca a una región superficial de semiconductor de este tipo. Se verá específicamente el caso en que el metal tiene una función de trabajo más pequeña que el semiconductor tipo n, en donde la capa de acumulación rectificadora se formó en ausencia de estados superficiales. Esta situación se ilustra en la figura 16.8. En (a), la distancia d entre el metal y el semiconductor disminuyó hasta el punto en que se establece un túnel de electrones. Ahora, los electrones forman un túnel del metal a los estados superficiales, y si la densidad de los niveles superficiales es lo suficientemente grande, tales estados alojarán a todos los electrones que sean necesarios para establecer un campo eléc... rico lo suficientemente grande para igualar las energías de potenciales de los electrones en los niveles de Fermi respectivos y el estado final del sistema se encuentra en (b). La situación dentro del semiconductor es esencialmente la misma que en (a), excepto que el nivel de Fermi está un poco más alto con respecto a la distribución de estados de superficie, y esto da como resultado un cambio en la altura de la barrera superficial 81/J que, no obstante, puede ser muy pequeña, si la densidad de eSi.~os de superficie es apreciable. La capa de deficiencia y la barrera de potencial superficial permanecen todavía, y las propiedades de rectificación del contacto que están gobernadas sobre todo por estas mismas características, son prácticamente inalterables. Es fácil verificar que, dada una situación igual, excepto que la función de trabajo del metal sobrepasa a la del semiconductor, el cambio de altura de la barrera 81/J es de signo opuesto y el efecto túnel de los estados superficiales al metal reduce el nivel de Fermi con respecto a la distribución de estados superficiales. 7 También en este caso las propiedades de rectificación quedan prácticamente 7 Si todos los estados de superficie tienen la misma energía tes decir, si su distribución es esencialmente una función 1>), no habrá ningún cambio en absoluto en la altura de la barrera.

Estados superficiales y rectificación independiente

523

Efecto túnel hacia los estados superficiales

1 - - - - d----1

~+:----+.,...

d

(a)

Figura 16.8.

(b)

Diagrama que ilustra las etapas sucesivas para establecer el equilibrio entre un metal y un semiconductor con estados superficiales. Si la densidad de estados superficiales es bastantes grande, la distribución de carga espacial interna apenas se verá afectada.

sin cambio. Por tanto, las características de rectificación son prácticamente independientes de los valores relativos de las dos funciones de trabajo, lo cual concuerda con lo que se observa en la práctica. Otra demostración experimental de la existencia de los estados superficiales se encuentra en el llamado experimento de efecto de campo, en el que se hace que un semiconductor funcione como una de las placas de un condensador de placa paralela, como se indica en la figura 16.9. En este dibujo se utiliza una muestra de germanio tipo n, como placa de condensador negativo y se induce una carga superficial negativa tan grande como sea posible, conectando una fuente de alto voltaje entre las placas. Puesto que la capacitancia de un condensador de placa paralela es A/4rrr, en donde A es el área de las placas y r su separación, se inducirá una carga de magnitud

V0 A

q =CV0 = -

(16.3-1)

4nr

+

~r---------------------,1

a~~oenvtoeltdaeJ·e -=

+Vo~~~~~~~-L +++++++++++++,+++++++++++ r

o

~~ + Fuente de corriente

E0 = l{¡¡d

-----n--G;--- !"---- -- -,-

h

Potenciómetro

J=
Figura 16.9.

Diagrama esquemático del experimento de efecto de campo y circuitos asociados.

••

524

Contactos metol·semiconductor y superficies de semiconductores

en el semiconductor, cuando se aplica una diferencia de potencial V 0 • Si no hubiera estados superficiales, esta carga se compondría sólo de electrones libres móviles dentro de la banda de conducción en la superficie. El número de portadores de carga inducidos, AN es sencillamente qje, o bien,

V0 A

AN=-.

4n:er

(16.3-2)

Este cambio en el número de electrones libres móviles produciría un cambio en la conductividad de muestra t:.a que equivale a (16.3-3) en donde V es el volumen de la muestra. Si el volumen V se escribe como el producto del área A y el espesor de la muestra h y se substituye en (16.3-2) el valor de AN, se obtiene finalmente VoJ.l.n !la=--

(16.3-4)

4nhr

como el cambio en la conductividad medida de la muestra, debido a la presencia de la carga superficial inducida. No obstante, cuando el experimento se realizó, se descubrió que el cambio de conductividad observado era sólo un décimo del valor predicho por esa expresión. 8 Bardeen interpretó el resultado del experimento, señalando que esto indicaba que aproximadamente el 90 por ciento del exceso se transfiere a los estados superficiales, en lugar de hacerlo a la banda de conducción del semiconductor, y que los electrones de estos estados son inmóviles, en lugar de libres.

16.4

POTENCIAL, CAMPO Y CARGA EN LA CAPA SUPERFICIAL DE UN SEMICONDUCTOR

A continuación se verán detalladamente los campos y los potenciales que se establecen dentro de la región superficial cuando hay estados superficiales presentes. En general, se supondrá que se tiene un campo aplicado E 0 fuera de la superficie del semiconductor, que se genera mediante algún aparato experimental de efecto de campo, como se demuestra en la figura 16.9. La situación dentro del cristal será entonces la que se representa en la figura 16.7. Se observará que el origen de la función de potencial cp(x), que se puede escoger de un modo arbitrario, se define como el punto en donde el material es intrínseco (es decir, en donde p 0 = n 0 = n¡)c/J es cero. Esta es la misma elección que se hizo en la exposición sobre la unión p-n en la sección 12.3. En efecto, hay muchos puntos de similitud entre los dos ejemplos. En estas circunstancias, la variación de las energías de borde de la banda de conducción y valencia, en función de la distancia, queda demostrada por ( 12.3-6) y (12.3-7), en tanto que las densidades de portadores en cada punto, dentro de la 8 W. Shockley y G. L. Pearson, Phys. Rev., 74,: 223 (1948).

Potencial, campo y carga en la capa superficial de un semiconductor

525

banda, está representada por (12.3-4) y (12.3-5). Las densidades de portadores se pueden expresar como sigue (16.4-1) y (16.4-2)

Sin embargo, puesto que Ue e -h.;-•tlfkT

_

-

ni _U e-<•1 -•.;)/kT v '

de acuerdo con (9.3-6) y (9.3-15), éstas se pueden escribir sencillamente como (16.4-3) (16.4-4)

Si se supone que todos los donadores y receptores están ionizados, la ecuación de Poisson toma la forma

= 4nen 1 (zsenh ecf>(x) _ Nd-

"

kT

Na).

(16.4-5)

n1

Por supuesto, aquí se supone que la simetría del sistema es tal que el potencial varía sólo a lo largo de la dirección x. Si la superficie es un plano y si la muestra es uniforme, esta condición se puede lograr en la práctica. Si ahora el potencial se representa mediante una variable, sin dimensiones u, entonces

u(x) = ecf>(x)fkT,

(16.4-6)

y (16.4-5) se convierte en

d2 u -d2 X

2 (senh u(x) -

= L-r DI

Nd2n¡

Na) ,

(16.4-7)

en donde LDi es la longitud intrínseca de Debye y como la define (10.2-49). Esto ie puede escribir en una forma que es incluso más sencilla, haciendo notar que, a ;ma gran distancia dentro del semiconductor, a valores muy grandes de x lim n(x)

= n0 = n1ee•s/kT

=n e" 1

8

JC .. OO

por lo cual

u8

no

= ln-.

n;

(16.4-8)

526

Contactos metal-semiconductor y superficies de semiconductores

En este caso lf>B (y, por ende uB) se relaciona con el potencial electrostático que queda en lo más profundo del cristal, como se indica en la figura 16.7. Expresando la cantidad uB = 1n(n 0 /n;) en función de Nd -Na por medio de (9.5-23), y recordando que 1n(x +v'1 +x 2 ) = senh - l x, (16.4-7) se puede expresar como

d2 u -

dx

2

2

= - 2- (senh

LD,

u- senh u 8 ).

También debe observarse que, puesto que

n0

u 8 = In -

n;

(16.4-9)

n0 p 0 = nl,

n; Po = -In - . Po n;

= In -

(16.4-10)

Se puede integrar una vez (16.4-9), haciendo que du e dt/J eE F= - - = - - - = - - dx kT dx kT

(16.4-11)

en donde E(x) =- dlf>/dx es el campo eléctrico. Por tanto d 2u dF dF du dF -= --= ---=Fdx2 dx du dx du ·

(16.4-12)

Si se substituye esto en (16.4-9) y se integra desde F =O (correspondiendo a x = ""• muy adentro, en donde el campo desaparece claramente), hasta un punto interior arbitrario, se puede obtener la relación F = - -du = - 2 dx LDI

J cosh u -

cosh u 8

-

(u - u 8 ) senh u 8 ,

(16.4-13)

que conecta el valor del campo en cualquier punto al valor del potencial. Esto se puede integrar una vez más, en esta ocasión, entre los límites x =O (correspondiendo a la superficie, en donde u= u8 = elf>s/kT) y un punto interior arbitrario, lo cual da

LDifu

x= -

T

du

usJcosh u- cosh u 8

-

(u- u 8 ) senh Us

(16.4-14)

La relación entre el campo y el potencial, dentro de la capa de carga espacial inmediata a la superficie, se puede obtener, substituyendo u= u8 en (16.4-13), para mostrar

F =-(du) =-eEs=.2_Jcos u - cos u 8 -(u -u 8 ) senu 8 • s dx s kT LDI s s (16.4-15) Desafortunadamente, por lo general no puede integrarse en general en forma cerrada la ecuación (16.4-14), a fin de dar una relación explícita que describa a u en función de x. No obstante, existe un caso en que se puede obtener una solución analítica exacta, correspondiente a un material en el que Nd- Na= O, de donde,

Potencial, campo y carga en la capa superficial de un semiconductor

527

n 0 = n¡ y uB = O. En consecuencia, el cristal semiconductor volumétrico es intrínseco en sus profundidades y esa situación particular se denomina caso de volumen intrínseco. Dado que uB =O en (16.4-13), se p1.1ede demostrar fácilmente que, para

este caso particular du

2J2

u

F = - - = --senh-. dx L 01 2

(16.4-16)

esto se puede integrar ahora como se indicó antes, en donde la ecuación resultante como solución para u sea u(x)=4tanh- 1 ( e

-x../2 L 01

Us )

tanh-¡.

(16.4-17)

Evidentemente, la relación entre el campo y el potencial dentro de la capa de carga espacial en la superficie del cristal es, para este ejemplo Fs

eE5

=- -

kT

2j2

u

LDi

2

5 = - - senh-.

(16.4-18)

Los campos superficiales se pueden relacionar con la densidad de carga de los estados de superficie, la carga espacial por unidad de área superficial y un campo externo E 0 , que se puede considerar que se aplica como se ilustra en la figura 16.9, aplicando el teorema de flujo eléctrico de Gauss a volúmenes cilíndricos cuyos ejes son normales a la superficie del semiconductor, como se indica en la figura 16.10. Considerando primero la superficie gaussiana S 1 que se encuentra en la parte superior del diagrama, el teorema de Gauss 9 requiere que

Js,j D • n da = 4nq

(16.4-19)

en donde D es el vector de desplazamiento eléctrico y n es la normal hacia afuera. Es obvio que en las superficies laterales del volumen cilíndrico, n y D son mutu~t­ mente perpendiculares y el producto escalar desaparece. En los otros extremos del cilindro, se obtiene (16.4-20) en donde A 1 es el área del extremo de la superficie cilíndrica y ~s es la densidad de carga por unidad de área en los estados de superficie. Puesto que puede suponerse que la altura del cilindro es infinitesimalmente pequeña, se puede hacer caso omiso de la cantidad de carga dentro de la superficie que produce la parte de la carga espacial del volumen interior que se incluye ahí. Puesto que D 0 = E 0 y Ds = KEs, el resultado se puede expresar como sigue (16.4-21) 9 Véase, por ejemplo, J. R. Reitz y F. J. Milford, Foundations o[ Electromagnetic Theory, Addison Wesley Publislting Co., Reading, Mass. (1960), p. 77.

S28

Contoctos metal-semiconductor y superficies de semiconductores t---HlBOI~tn

de carga espacial----i Gaussiana St 1

1

Eo Do

Densidad de carga espacial por unidad de área en los ~os wperficiales E, o, Gaussiana

~a 1

1

s2

Carga l:¡ por unidad de área de superficie en la región interior de la carga espacial Superficie Figura 16.10.

Diagrama que ilustra la construcción de las superficies gaussianas y las notaciones usadas para los cálculos de la sección 16.4.

Ahora, el teorema de Gauss se puede aplicar del mismo modo a la superficie

S2 ; puesto que el campo que está en lo más profundo desaparece, el resultado será (16.4-22)

en donde

~¡ ~t

es la carga por unidad de área superficial en la región de carga espacial representa la carga total por unidad de área superficial. Al substituir el valor dado por (16.4-21) en lugar de ~s en (16.4-22), se ve claramente que la relación entre la intensidad del campo interior ~s en la superficie y la densidad total de carga espacial interior ~¡ es

interior y

(16.4-23)

Si se conoce la densidad y la distribución de estados superficiales y si se da el campo E0 aplicado externamente, se puede calcular el valor del potencial de superficie us. Una vez que esto se conoce, y las condiciones de frontera del potencial interior se establecen, este potencial y el campo, así como la densidad de carga espacial interior, se pueden determinar con claridad. Para ilustrar mejor esto, se verá el caso del volumen intrínseco en donde se tienen Ns estados superficiales de tipo receptor por unidad de área superficial, en donde todos tienen una energía es. Entonces, la densidad de estados de superficie (cm- 2 ) se puede representar como (16.4-24)

Potencio/, campo y carga en la capa superficiol de un semiconductor

529

El nivel de energía asociado con los estados de superficie se localiza en un valor fijo con respecto a los bordes de la banda de conducción y valencia en la superficie. Puesto que esto último varía de acuerdo con el valor del potencial de superficie, lo mismo sucede con la energía de los estados de superficie es; en realidad, haciendo referencia a la f¡gura 16.11, es evidente que

(16.4-25) en donde Eso es la diferencia de energía entre el nivel superficial y el punto intrínseco dentro de la banda prohibida. Por tanto, puesto que en el caso volumétrico intrínseco e¡= O, se puede escribir ns, que es el número de electrones en los estados de superficie por unidad de área superficial

ns =

er/Js e<• t¡)/kT f.•·fo(e)gs(e) de= Ns f.'" c5(e-1 +(esole

le

0 ))

Ns de= 1 + e<•so e•s>Jir.T · (16.4-26)

La densidad de carga superficial Ls es entonces

(16.4-27) y, de acuerdo con (16.4-21) y (16.4-18), se puede escribir una ecuación para el campo superficial interno Es en la forma

E _ 4_7t_L_s + E 0 S -

K

-4neNs ___1-=,..---- + E 0 = 2j2kT senh Us. K 1 + e•so/kT e us K eL01 2

_

K -

(16.4-28) de donde, [recordando (10.2-29)]; 1

1 + e-so/lr.Te-us

=

~ _ 2Jln1L 01 senh u5 4neNs

Ns

(16.4-29)

2.

Distribución de estados en la superficie

-x

--:::.---:-.---:.:-----:-+---.-=--- ••(x) x=O

Superficie Figura 16.11.

Diagrama de potencial y notación utilizada para el cálculo del potencial superficial como función del campo aplicado, que se vio en la sección 16.4.

530 Contactos metal-semiconductor y superficies de semiconductores f(u,)

'(

2./2n L ) - Eo u,---4.,.eN, Ns

1 01

sen h -u,2

-1

Figura 16.12.

Diagrama que ilustra la solución gráfica de la ecuación (16.4-29) y la variación del potencial superficial en función del campo aplicado y otras variables.

En principio, esta ecuación se puede resolver para us, con el fm de detenninar el potencial de superficie. No obstante, las dificultades algebraicas para llegar a una solución analítica son tan grandes 10 que para los fines presentes, una solución gráfica como la que se ilustra en la figura 16.12, nos proporcionará más datos. En esta figura, las expresiones que aparecen al lado izquierdo de (16.4-29) y las del lado derecho de dicha ecuación, aparecen graficadas por separado, como funciones de Us. En la intersección de las dos curvas, las funciones son iguales y la coordenada Us de dicho punto representa la raíz verdadera de (16.4-29). La varia· ción del valor de us en función del campo aplicado, se puede estudiar. observando que, confonne varía E 0 , la curva senh se traslada hacia arriba o hacia abajo, en fonna paralela al eje f(us). Para E 0 =O, us es invariablemente negativa, correspondiendo a un valor positivo para - eif>s. Esto es de esperarse, ya que los electrones de los estados superficiales crean una capa de carga espacial superficial positiva y, por ende, una región queda con una deficiencia de electrones, como se indica en la figura 16.11, lo cual conduce a un valor positivo para - eif>s· Con las densidades de estado superficial que generalmente se asocian con las superficies de gennanio y silicio, se encuentra que la energía potencial de superficie, puede variarse a lo largo de diversas unidades kT a ambos lados del valor de campo cero, mediante la aplicación de valores de E 0 que puegan alcanzarse experimentalmente, dentro de un experimento de efecto de campo como el que se ilustra en la figura 16.9. Una vez que se detennina Us en función de las cantidades conocidas N s, eso y E 0 mediante este método, la fonna precisa del potencial interior se sigue de (16.4-17), el campo interno Es en la superficie se sigue de ( 16.4-28) y la densidad de carga de los estados superficiales de (16.4-27) y la densidad de carga interior de (16.4-23). Se puede usar el mismo planteamiento con otras muestras de volumen intrínseco, aunque las operaciones matemáticas son IJ\UCho más complejas. Desafortunadamente, en la práctica casi siempre se desearía invertir este procedimiento, comenzando con valores experimentales de la densidad de carga superlO Si se substituye x =e·•s en (16.4-29), se puede demostrar que esta ecuación se reduce a una ecuación cúbica en x, que cuenta sólo con una raíz real.

Conductividad duperficial

531

ficial e interior, en función del campo aplicado, derivando los valores correspondientes de Es y u8 en función del campo, e infiriendo de estos datos, la densidad de los estados de superficie y su distribución de energía. Este problema es mucho más difícil y la respuesta se puede obtener casi siempre probando varios modelos con estados de superficie supuestos modificándolos conforme sea necesario para obtener un ajuste satisfactorio de los datos experimentales, cuando se efectúe el cálculo antes descrito. Algunas de las sutilezas incluidas en estas mediciones de efecto de campo y las cohclusibnes que deben obtenerse de los resultados experimentales, se analizarán en la siguiente sección.

16.5

CONDUCTIVIDAD SUPERFICIAL, EFECTO DE CAMPO Y MOVILIDAD SUPERFICIAL; PROPIEDADES DE SUPERFICIES DE SEMICONDUCTORES REALES

En el experimento de efecto de campo de la figura 16.9, la conductancia de superficie que se origina, debido a un incremento o una disminución de la densidad de portadores dentro de la región de carga espacial, se puede medir como una función del campo aplicado. El total de la densidad de carga inducida ~t• puede inferirse de (16.3-1) como V0 /(41Tr). De acuerdo con estos datos, se puede calcular la variación del potencial de superficie con el campo aplicado y, por tanto (utilizando los procedimientos delineados en la sección anterior), obtener información respecto a la densidad y la distribución de energía de los estados superficiales. Si se usa nuevamente el caso de volumen intrínseco como ejemplo, es evidente que si t/Js es cero, no se tendrá una capa de carga espacial de superficie y el valor volumétrico de conductividad prevalecerá incluso en la región superficial. Si t/Js es positivo (y, por ende, - et/Js es negativo), las bandas que se ilustran en la figura 16.11 se doblarán hacia abajo, cerca de !a superficie y los electrones que se generan térmicamente en el interior se deslizarán por la barrera de energía potencial y se acumularán cerca de la superficie, en tanto que la región superficial repelerá a los huecos. En efecto, la superficie será tipo n. La concentración de electrones cerca de la superficie, como función de t/J, está dada por (16.4-3) y la concentración de huecos por (16.4-4). Es evidente que si t/Js es bastante grande, la concentración superficial de electrones puede ser varios múltiplos del valor que tiene en la parte volumétrica y, por tanto, la conductividad eléctrica de la capa superficial sera mayor que en la parte volumétrica. En consecuencia, se produce un aumento en la conductancia de la muestra. De la misma manera, si t/Js es negativo, las bandas se doblarán hacia arriba y la • acumulación resultante de huecos en la superficie puede originar una conductividad en la capa superficial que es mucho mayor que el valor volumétrico. Aparentemente, la conductancia de la muestra llegará a un valor mínimoll cerca de t/Js =O y aumentará conforme t/Js se desvíe de ese valor en cualquier dirección. Los valores exactos de tP(x) y por ende n(x) y p(x), así como la conductividad, se pueden calcular como funciones de t/Js utilizando los métodos delineados en la sección 16.4 y, por tanto, se puede construir una gráfica exacta de la conductancia de muestra en función de t/Js (o en [unción de ~¡, que se relaciona con t/Js a través de (16.4-23) y (16.4-18)). Al hacer estos cálculos, se debe reconocer que los portadores dentro de la capa superficial están sujetos a un proceso de dispersión que no afecta a los portadores de la sección volumétrica, es decir, la dispersión de superficie. El efecto 11 El mínimo no se encuentra exactamente en el punto dades de electrones y huecos no son iguales.

t/Js = O, debido a que las movili-

532

Contactos metal-semiconductor y superficies de semiconductores

de la dispersión de superficie dentro de las capas de carga espacial fue analizado por Schrieffer 12 , que adoptó el modelo simple de potencial lineal para hacer la aproximación de: verdadero potencial de superficie. Se encontró que la movilidad superficial se reducía del valor volumétrico en un factor que dependía del potencial superficial. En el germanio puro, este factor varía de la unidad correspondiente a cf>s = O a aproximadamente 0.4 para los valores mayores de cf>s que pueden r 1 canzarse experimentalmente. El valor del factor depende también, en parte, de la densidad volumétrica de portadores. 13 En la figura 16.13 se presenta esta gráfica para una muestra de germanio casi intrínseca.1 4 En el mismo diagrama-se grafica el valor experimentalmente determinado del cambio de conductancia como función de la carga total inducida l:¡. Primero se verá un valor particular observado del cambio de conductancia. Los valores correspondientes de l: 1 y l:¡ se pueden leer en las curvas y, puesto que el cambio de conductancia se produce debido casi totalmente a la región de carga espacial, el valor de cf>s en la curva computada correspondiente a este valor del cambio de conductancia es el valor real del potencial de superficie. La distancia

i:lc (J.unho por cuadro) 10~----r----.,----.-----.-----.----~----------~----~----·

Ge,

tipo-p

40 ohm-cm (300"K)

-lO

-8

-6

-4

6

8

lO X 10 9

I; or I, (Couls 1 cmZ)

Figura 16.13.

Valores observado y computado de la carg~ superficial, en función del potencial de superficie y el campo aplicado. (Según W. L. Brown, W. H. Brattain, C. G. B. Garrett Y H. C. Montgomery en Semiconductor Surface Physics, R. H. Kingston, Editor, University of Pennsylvania Press, 'Filade.lf"Ia [1957], p. 115.)

12 J. R. Schrieffer, en Semiconductor Surface Physics (R. H. Kingston, Red.) University of Pennsylvania Press, Filadelfia (1957), p. 55. 13 Esto se puede entender, recordando que en las muestras en donde la concentración de impurezas en el volumen es grande, el espesor de la región de carga espacial superficial es pequeño y viceversa. En cristales relativamente puros, el espesor de la capa de carga espacial superficial será casi siempre mucho mayor que la trayectoria libre media para la dispersión dentro de esta región, y el efecto del metanismo de dispersión superficial en la conductancia total de la capa superficial será insignificante. Al aumentar la densidad de impurezas, el espesor tot¡¡], de la región de carga espacial puede hacerse del orden de la trayectoria libre media o menor. En tales circunstancias, la contribución de la dispersión superficial a la movilidad general asociada con la conductancia de la capa superficial puede ser muy importante. 14 Este ejemplo en particular fue examinado por W. L. Brown, W. H. Brattain, C. G. B. Garrett y H. C. Montgomery en Semiconductor Surface Physics (R. H. Kingston, redactor), University of Pennsylvania Press, Filadelfia (1957), p. 115.

Conductividad superficial

533

horizontal entre las dos curvas corresponde a la densidad de carga de los estados superficiales. La variación de c/Js con la densidad de carga de los estados superficiales ~s se puede obtener en forma directa, y se puede buscar un modelo de estados superficiales que produzca esta variación observada. Se ha encontrado experimentalmente que el ambiente gaseoso en que se sumerge la muestra, tiene un efecto profundo en la estructura de los estados superficiales. En efecto, se puede hacer que en el campo cero el valor del potencial de superficie varíe a lo largo de una gama amplia, cambiando simplemente la naturaleza de la atmósfera que rodea a la muestra. Por ejemplo, se ha encontrado 12 que la presencia del ozono en el ambiente gaseoso produce, en el caso del germanio, un gran valor negativo de c/Js y, por ende, una superficie de un fuerte tipo p en tanto que un ambiente de aire húmedo produce un gran valor positivo de c/Js y, por tanto, una superficie de un fuerte tipo n. Otro fenómeno que se aprecia con claridad es el relajamiento lento del efecto de campo. Cuando se aplica un voltaje en el experimento que se ilustra en la figura 16.9, se observa inmediatamente un cambio en el potencial de superficie y una variación en la densidad de carga espacial interna; pero el potencial de superficie decae en forma gradual (durante un periodo que, dependiendo de la superficie y la temperatura, varía de segundos a horas o días), hasta llegar a un valor muy aproximado al de campo cero. Este efecto se ha explicado, suponiendo que existen dos clases distintas de estados superficiales, un grupo de estados ''rápidos" que interactúan con gran rapidez con la región de carga espacial interna y un grupo de estados "lentos", que pueden interactuar sólo con gran lentitud con el interior del cristal. Por lo general, se considera que los estados rápidos residen en la superficie del cristal semiconductor, en tanto que los lentos se asocian con la superficie externa de la capa de óxido que, por lo general, se encuentra presente en las muestras de germanio o silicio. Este punto de vista de la situación se ve respaldado porque el tiempo de relajación para los efectos de campo se hace muy grande, cuando están presentes gruesas capas de óxido. La magnitud de los efectos de campo ''rápidos" observados y el hecho de que el potencial superficial se relaja casi siempre hasta un valor no muy distinto del de campo cero, después de un nempo prolongado, sugiere que la densidad de los estados rápidos del germanio es típicamente del orden de 10 10 ó 10 12 cm-2, en tanto que la densidad de los estados lentos es mucho mayor, quizá del orden de casi 10 15 cm-2. Se considera que los efectos asociados con los cambios en el ambiente gaseoso, se relacionan principalmente con los estados de superficie lentos, dejando a los rápidos casi sin ningún efecto. El hecho de que la densidad observada de los. estados de superficie rápidos es mucho menor que el valor que predicen las teorías de Tamm y Shockley, nos llevan a la conclusión de que los estados rápidos no pueden identificarse con los estados Tamm, por lo menos en la forma simple en que se representan en estas investigaciones teóricas. También es evidente, de acuerdo con los resultados precedentes, que los estados de superficie y la distribución de potencial superficial deben ser los principales causantes de la determinación de la probabilidad de recombinación para portadores en exceso incidentes en la superficie y, por ende, para el establecimiento del coeficiente de reflexión superficial y la velocidad de recombinación superficial. Sobre todo, se puede ver claramente que los valores medidos del coeficiente de reflexión superficial no representan el coeficiente de reflexión "real" de la superficie, sino que expresan el efecto combinado de la superficie propiamente dicha y la región de carga espacial correspondiente en la recombinación de los portadores en exceso, dentro de la región superficial. Por tanto, es de esperarse que la velocidad de recombinación superficial se vea afectada por cualquier cosa (por ejemplo, campos aplicados, temperaturas, ambiente gaseoso) que puedan alterar el potencial superficial al igual que cualquier factor que pueda modificar la densidad y la distribución de los ni-

534

Contactos

metol~emiconductor

y superficies de semiconductores

veles superficiales mismos. Steveson y Keyes 15 emprendieron un análisis detallado de la recombinación superficial, basándose en la teoría de recombinación de ShockleyRead. Esta teoría presupone que los estados superficiales pueden actuar como tr¡unpas Shockley-Read y predice una relación entre la velocidad de recombinación superficial y el potencial superficial que, en general, está de acuerdo con los resultados de mediciones experimentales. los resultados parecen indicar que son los estados superficiales rápidos y no los lentos los que tienen una importancia primordial para determinar la velocidad de recombinación superficial. EJEROCIOS l. Utilice la línea de razonamiento desarrollada en la sección 16.1, para analizar detalladamente la naturaleza del contacto ideal en el que no se comprenden estados superficiales entre un metal y un semiconductor tipo p. 2. Derive la relación corriente-voltaje para un contacto rectificador entre un metal y un semiconductor tipo p (t/>sc>tf>M>· Suponga que no existen estados de superficie. 3. Examine la naturaleza de la capa de carga espacial superficial que se forma cuando los estados superficiales de tipo donador (neutros cuando están ocupados por electrones y positivamente cargados cuando están vacíos), estlÍJI presentes en la superficie de un semiconductor. 4. Demuestre explícitamente, utilizando el planteamiento adoptado en la sección 16.3, que las propiedades rectificadoras de un contacto metal-semiconductor tJ>M >tf>sc son prácticamente iguales a las que se observen cuando tf>M tf>sc siempre que esté presente en la superficie del semiconductor una distribución de estados superficiales originada por una capa de deficiencia. S. Compute el porcentaje de cambio de conductividad que deba esperarse, si no hay estados superficiales presentes, cuando se aplica una diferencia de potencial de 1000 V a una distancia de 0.1 mm, a una muestra de germanio tipo n que contiene 10 14 electrones por cm 3 en equilibrio, que tiene un espesor de 0.1 mm. 6. Reproduzca los aspectos matemáticos de la derivación del campo eléctrico, el potencial y la densidad de carga espacial interna integrada, relacionados con el caso del volumen intrínseco.

<

LECTURAS RECOMENDADAS W. H. Brattain y J. Bardeen, "Surface Properties of Germanium," Bell Syst. Tech. J, 32 1 (19S3). D. R. Frankl, Electrical Properties of Semiconductor Surfaces, Pergamon Press, Londres (por publicarse, 1966). R. H. Kingston (editor), Semiconductor Surface Physics, University of Pennsylvania Press, FiladeliJa (19S7). R. H. Kingston, "Review of Germanium Surface Phenomena," J. Appl. Phys., 21, 101 (1956). C. G. B. Garrett y W. H. Brattain, "Physical Theory of Semiconductor Surfaces," Phys. Rev., 99, 376 (19S5). T. B. Watkins, The Electrical Properties of Semiconductor Surfaces, en Progress in Semicon· ductors, Heywood and Co., Londres (1960), Vol. S, p. 7. J. N. Zemel (editor), Semiconductor Surfaces, Pergamon Press, Londres (1960).

15

D. T. Stevenson y J. R. Keyes, Physica, 20, 1941 (1954).

APENDICE

A

La función 8 Dirac Se puede considerar que la función 8 Dirac tiene las siguientes propiedades:

b(x- x 0 ) =O,

(x

=1=

x 0)

(Al)

y

(A2) en donde e 1 , e2 son cualesquiera números positivos que puedan ser arbitrariamente pequeños (pero en realidad no lo son). Evidentemente, puesto que, de acuerdo con (Al)8(x-x 0 ) es cero en todas partes, excepto en X=X 0 , para que (A2) sea verdad, la función debe ·ser infmita en x = x 0 • La función 8 Dirac se puede considerar entonces como una función 1 "pico" como la que se ilustra en la figura Al. f(x)=

8(x-x0 )

-+----..u------x O Xo Figura Al.

Representación visual aproximada de la función 8 Dirac 8(x- xo) como un "pico" de altura infinita en el punto x =X o.

La propiedad matemática más importante de la función 8 Dirac se expresa mediante la ecuación (A3)

1 Estrictamente hablando, la función 8 no satisface los requisitos matemáticos rigurosos que definen una función y, en el sentido estricto de la palabra, no se trata de una función en absoluto. Sin embargo, se puede considerar como el límite de un conjunto de funciones que tienen un área unitaria y que se hacen progresivamente más delgadas y más altas, alrededor de un solo punto, x =X o. En efecto, las funciones (10.3-23) como x' =Xo, E o= O y t' =O forman precisamente un conjunto de este tipo en el límite t-+ O. Este conjunto se ilustra (para el caso en que X o= O) en la figura 10.7(a).

535

536 Apéndice A: La función 5 Dirac en donde j(x) es una función de x que defmida en x = x 0 . Se puede llegar a este resultado simple, observando que si la función 5 se multiplicara por una constante A, entonces, de acuerdo con (A2) se podría escribir

f

xo+•z

.xo-e:t

Ao(x - Xo) dx = A

f"o+12o(x -

Xo) dx = A .

(A4)

xo-et

Si en lugar de ser una constante multiplicada por la función 5 el integrando se da como una función, específica de x, multiplicada por la función 5, se puede evaluar la integral, suponiendo inicialmente que e 1 y e2 son extremadamente pequeños. Entonces, si f(x) tiene un comportamiento adecuado en las cercanías de x = x 0 , se puede considerar que la función j(x) tiene el valor constan te j(x 0 ) a lo largo de un pequeño intervalo (x 0 - € 1 <x 0 <x 0 + e2 ), de donde

(AS)

Sin embargo, es claro que, en vista de (Al) y (A2), el valor de la integral es independiente del valor que se escoja para e 1 y e 2 • Por tanto, el resultado (A3) queda demostrado. La función 5 Dirac se utilizará en este trabajo para evaluar ciertas integrales que se presentan en conexión con la estadística de Fermi-Dirac de los sistemas de electrones libres y para describir la función de la densidad de estados para sistemas que tienen niveles discretos de energía que utilizan el procedimiento desarrollado en relación con sistemas con una densidad casi continua de estados cuánticos. No obstante, se ha encontrado que es útil en una variedad de situaciones que se presentan en otras ramas de la física matemática.

APENDICE

B

Análisis temorial El tensor se puede considerar como el producto de una yuxtaposición lineal de dos o más operaciones vectoriales. Por ejemplo, suponga que se busca el gradiente de un vector. Se puede proceder aplicando el operador gradiente (ixa¡ax + iya¡ay + izajaz) a un vector A. Se obtiene

VA

= (1..,. axa + •,. aya + •z. aza)<·•..A"+ •,. A' + •z. Az)

(Bl)

Aparentemente, el gradiente de un vector tendrá nueve componentes de la (en donde a:= X, y =X, z). Existen dos direcciones asociafonna das con cualquier componente de esta índole. En este ejemplo, la dirección en la que se toma la componente del vector y la dirección en la que cambia, es lo que s~ está estudiando. Las entidades i ..i 6 (a:, (j = x, y, z) son evidentemente análogas de los vectores unitarios, y se conocen como diadas unitarias. La suma (Bl) se llama d{ada y las nueve componentes 6 tomadas juntas se denominan componentes de un tensor de segundo rango. El tensor de segundo rango puede considerarse como una colección de nueve componentes que están sujetas a ciertas leyes de transfonnación, al pasar de un sistema de coordenadas a otro, al igual que el vector se puede defmir mediante tres componentes que obedecen a ciertas reglas de transfonnación de coordenadas. Se puede considerar que la díada unitaria obedece a las leyes acostumbradas de productos vectorial y escalar para los vectores unitarios; por ejemplo

aA,Jax,,

y, z x,

y,

aA,JoA

(82)

o bien

en donde ~.., es la li Kronecker. En estas circunstancias, las operaciones de producto cruzado y punto entre un tensor y un vector y entre dos tensores, se pueden definir mediante las reglas para estas operaciones aplicadas a vectores unitarios. Por ejemplo, 537

538 Análisis tensorial sea un tensor de segundo rango 1 que tiene nueve componentes expresar como

T.,,

que se puede (B3)

y un vector

(B4)

A= ¿A,.i,..

,.

Entonces, de acuerdo con (B2),

Si se suma sobre #J. y, observando que obtiene finalmente T •A =

lJ,,. =

O, excepto cuando #J.= {3, se

L L T.,A,i. = (T.x.xA.x + T.x,Ay + TX%A%)i.x

-

11.

,

+ (T,.xA.x + T"A' + T,zAz:)i, (BS) El producto de punto de un tensor y un vector es, por ende, un vector. De la misma manera, se puede demostrar fácilmente que A •! =

L L T.,A,.i, = (T.x.xA.x + T .xAy + TuAz}i.x 1

11.

,

(B6) De acuerdo con estos resultados, es obvio que los dos productos de punto (BS) y (B6) son iguales sólo si ! es un tensor simétrico para el cual = También se puede demostrar fácilmente que la operación de producto punto equivale a una multiplicación matricial. Por tanto, se supone que las componentes del tensor se consideran como las componentes de una matriz cuadrada de 3 por 3 y las componentes del vector se escriben como una matriz columna. Por tanto, de acuerdo con las reglas de multiplicación de matrices2 ·...

T., T,•.

T.x.xT.x,Tnl [A.xl [T.x.xA.x + T.x7 A1 + T.xzAzl [ T1.xTyyTyz A, = T,.xA.x + TyyA:v + T,zAz =!·A. TuT.,Yzz Az TuA.x + Tz:7 A1 + T,,Az

(B7)

El producto de punto A·! se puede desarrollar en forma similar, excepto que ahora el vector A debe escribirse como una matriz renglón para efectuar la multiplicación. (B8)

El tensor se denotará mediante una letra en tipo negro con subrayado, es decir: !· Para esto, y una explicación más amplia de los tensores, el lector puede consultar D. H. Men;r;el, Mathematical Physics, Dover Publications, Nueva York (1961), p. 86 ff. 1

2

Análisis tensorial 539 El resultado es exactamente el que se da en (B6). El producto tensorial de dos tensores, que se escribe TU o ! :U se puede defmir como el producto matricial de las dos matrices componentes, por lo que

(B9)

en donde

(TU),.p =

L,. T,.,.U,.p.

(BlO)

Del mismo modo, se puede demostrar fácilmente que el producto doble · B =(A· !) · B =A· (! · B) de acuerdo con (BS) y (B6) es una cantidad escalar cuyo valor es A •!

(Bll) El tensor cuyos elementos están dados por T,.p = li,.p se conoce como tensor unitario o idemtensor L De donde,

!-

[~ !

n

De acuerdo con (BS) y (B6) o (B7) y (B8), es evidente que A·!=!·A=A,

(B12)

en tanto que, de acuerdo con (B9) o (BlO) se ve claramente que

Tl = lT=!,

(B13)

y, de acuerdo con (Bll), es obvio que

A ·1· B =A· B.

(B14)

Las expresiones tensoriales de producto cruzado se pueden evaluar en la misma manera, utilizando las reglas básicas de los vectores unitarios; por ejemplo (BlS) y así sucesivamente. El producto cruzado de un vector y un tensor es, evidentemente, un tensor. Los productos cruzados de tensores, no se utilizan en esta obra y no es necesario ampliar esta explicación para sus fmes inmediatos.

lndice Onomástico Azaroff, L. V., 20

Hall, R.N., 405,493 Hannay, N.B., 405 Haynes,j.R., 371 Herlet, A., 493 Herman, F., 319 Herring, C., 340 Hume-Rothery, W., 276

Bardeen,J., 520 Blackman, M., 191 Blatt, F. J., 340 Bloch, F., 232 Bohm, D., 117, 120 Boro, M., 69, 188 Bragg, W.L., 32 Brattain, W.H., 532 Brillouin, L., 54 Brody, T.P. 509 Brooks, H.., 308, 343 Brown, W.L., 532 Burgers,J.M., 416 Burton, J.A., 396, 405

Ikenberry, E., 100 Jenkins, D.P., 319 John, H.F., 485 Jones, H., 258, 276 Kármán, T. von, 188 Keyes, RJ ., 534 Keyes, R.W., 345 Kip, A.F., 319 Kittel, C., 319 Klemens, P.G., 199 Kronig, R. de L., 236

Casimir, H.B.G., 199 Churchill, R.V., 97, 121,386 Conkwright, N.B., 105 Conwell, E.M., 305, 319, 335, 344 Cottrell, A.H., 416 Craseman, B., 99

Lax, B., 319 Leighton, R.B., 34, 131, 133, 136, 137,138,192,340 Lewis, G.N., 403 Lorentz, H.A., 203 Lowdin, P., 75

Dash, W.C., 417 Debye, P., 33, 186 Dexter, R.N., 319 Dresselhaus, G., 319 Drude, P., 203

McAfee, K.B., 456 McKay, K.G., 456 McKelvey, J.P., 374,417 Madelung, E., 69 Mayer,j.E., 161 Menzel, D.H., 538 Merzbacher, E., 108, 128, 141 Meyerhof, W.E., 520 Milford, F.J., 527 Montgomery, H.C., 532 Morin, F.J., 417 Mott, N.F., 258 Muss, D.R., 459

Ehrenreich, H., 339 Erginsoy, C., 344 Esaki, L., 508 Evjen, H.L., 73 Ewald, P.P., 48 73 Franz, 203 Garrett, C.G.B., 532 Gopert-Mayer, M., 69, 161 Greene, R.F., 457

541

Indice54 2 Overhauser, A.W., 339 Pauling, L., 111, 119 Pearson, G.L., 417, 524 Peierls, R., 199 Penney, W.G., 236 Pfann, W.G., 404 Pipes, L.A., 331 Powell, J .L., 99 Randall, M., 403 Read, W.T., Jr., 392, 416, 417 Reitz,J.R., 527 Rutherford, E., 340 Scherrer, P., 33 Schrieffer,J. 532 Seitz, F., 75, 191,277 Seraphin, B., 402 Sherwin, C.W., 88, 127, 141 Shockley, W., 283,.339, 371 392,510, 521,524 Smith, C.S., 340

Smith, R.A., 219,248 Sokolnikoff, I.S., y E.S., 162 Sommerfeld, A., 203 Spenke,E.,246,493 Stevenson, D.T., 534 Tamm, l., 520 Transistor Teachers Summer School (Bell Telephone Laboratories), 3 74 van Roosbroeck, W., 354, 361, 392 Vogel, F.L., 417 Watson, G.N., 232 Weisskopf, V.F., 335 Wertheim, G.K., 417 Whittaker, E.I., 232 Wiedemann, 203 Wiesner, R., 497 Wilson, E.B., 111,119 Zeiger, H.J., 319 Zemansky, MW., 218 Zener, C., 456

Indice temático contribuciones electrónicas, 191,224 ff., 242 gas de fonones, 192 Cambios de fase, 273 ff. Cantidad de movimiento angular, o momento angular 138 operadores, 138 ff. valores esperados, 139 ff. Cantidad de movimiento del cristal, 240-241 ff., 247, 260, 273 Capacidad térmica, 83, 181 ff.

Absorción de borde, 348 Acoplamiento giro-órbita, 326 Aleaciones binarias, 2 7 3 ff. Aleaciones de cadmio y plata, 275 Antraceno, 402 Aproximación de Boltzmann, 289 ff., 297 ff, 428 ff., 507 ff., Aproximación de Debye, 188 ff. Aproximación de enlaces firme, 255 ff. Aproximación del electrón libre, 248 ff. Aproximación de nivel bajo, 355-356 ff., 427,443, 470,479 ff. Armónicos esféricos, 132 ff. Ataque químico, 379, 387 ff., 389 Atomo de hidrógeno, 84 ff., 128 ff. Atrapamiento, 390 Autoamplificación de la corriente de saturación, 474 ff., 504 ff.

Véase también Calor específico Capacitancia, uniones p-n, 435 ff. Carburo de silicio, 402 Celda unitaria, 14-15 Celda unitaria primitiva, 15 Centros de impurezas, 287 ff., 397 concentración, medición, 436 ff. energía de ionización, 292-293 ff. Circuito con emisor a tierra, 473 ff. factor de ganancia de corriente 474 Circuito de base abierta, 474 ff. Cloruro de cesio, 22, 73 Cloruro de sodio, 22, 72 ff. Cobre, 171,392,397,417 Coeficiente de difusión, 351 ff., 374 ambipolar, 355, 374,479 ff. Coeficiente de reflexión superficial, 375 ff., 533 Coeficiente de reflexión volumétrico, 375 ff. Colector, 372-373,463 ff. Colisiones, 205 ff. Compensación, 299 Compresibilidad adiabática, 73

Balance detallado, principio de, 375 ff., 393, 440 ff., 517 Banda de conducción, 282 ff. Banda de energía prohibida 253, 264, 269 ff., 282 ff., 336, 347 ff., 402, 445,459, 501 determinación experimental, 305,348 Banda de valencia, 282 ff. Banda prohibida, 239, 253 ff., 269 ff. Bandas de energía, 239 ff., 253 ff., 258 ff., 281 ff. Bandas de energía superpuestas, 271 ff. Barreras superficiales de potencial, 456, 515 ff. loro, 405 Calor específico de sólidos, 83, 84, 181 ff. teoría clásica, 181 ff. teoría de Debye, 186 ff. teoría de Einstein, 183 ff.

543

Indice 544 Compuestos intermetálicos (11-VI), 28 ff., 402 Compuestos intermetálicos (111-V), 23,28,243,360-361,390, 391,401 ff., 479 Condensación de Bose, 178 Condición de Bragg, reflexión de Bragg, 33,47 ff., 252, 253, 264 ff. Condiciones de frontera periódicas, 61,150,235,273 Conducción térmica, conductividad térmica, 195 ff. componente electrónica, 214 ff. Conductividad de la banda de impurezas, 305 ff., 509 Conductividad de superficie, 273 ff. Conductividad eléctrica, 206, 209 ff., 269 ff., 302 ff., 327 ff., 530 ff. de superficie, 530 ff. tensor, 195 ff., 214 ff. térmica, 328-329 ff. Constante de Boltzman, 83, 159, 167 Constantes de movimiento, 127-128, 140, 139 Contactos, metal-semiconductor, 454-455, 513 ff. Contactos óhmicos, 454 ff., 519 ff. Corriente de saturación, 440 ff., 452 ff., 518 ff. autoamplificación, 474-475 ff. Crecimiento de cristales, 407 ff. Czochralski, técnica de, 408 técnicas dentríticas, 408 técnicas epitaxiales, 406 proceso de zona flotante, 408 nivelación de la zona horizontal, 407 Crecimiento epitaxial del cristal, 407 Crecimiento, etapas del, 415 Cristal cúbico, 1 7 centrado en el cuerpo, 1 7 ff., 268,275 empaquetamiento compacto, 20 centrado en la cara, 17 ff., 268,275 simple, 17 ff., 25 7, 261, 268 Cristal hexagonal, 1 7, 268 con empaquetamiento compacto, 20,275 Cristal monoclínico, 1 7 Cristal ortorrómbico, 17 Cristal tetragonal, 15, 1 7 Cristal triclínico, 1 7 Cristal trigonal, 1 7, 18 Cristales covalentes, 27-28 Cristales iónicos, 27-28, 67 ff.

energía de enlace, 69 ff. Cristales metálicos, 29 Cristales moleculares, 29 Degeneración (cuántica), 135 ff., 151, 156 ff., 271, 295 ff. Densidad de probabilidad, 89 Deslizamiento, 413 ff. Desviación estándar, 122 ff. Detectores de partículas, 502 Detectores infrarrojos, 502 Diamante, 282 ff., 401 Difracción de rayos X,31 ff., 416-417 Difracción electrónica, 83 Difusión, 351 ff., 373,418-419, 421 ff., 462, 479 ff., 495 ff. ambipolar, 353 ff., 4 79 ff. Difusión ambipolar y arrastre, efectos de, 353 ff., 450 ff., 479 ff. Difusión, velocidad característica de,454 Diodos de perforación, 454 Diodos de referencia de voltaje, 455,460 Diodos túnel, 506 ff. Diodos Zener, 460 Dirac, función o de, 213-214, 296-297 ff., 368, 523, 528, 535 ff. Dislocaciones, 397,413 ff. tipo borde, 397,413 ff. tipo tornillo, 413-414 ff. Dispersión, 55 ff. relaciones, 56 ff. Dispersión de impurezas, 221, 257,313 ff. Dispersión de la red, 220, 245, 312 ff., 335 ff., 459, 490-491 Dispersión de modo óptico, 314 ff., 490-491 Dispersión superficial, electrones, 221,531 fonones, 199, 221 Dispositivos interruptores, 503 ff. Dispositivos interruptores p-n-p-n, 475 Dispositivos p-i-n, 479 Dispositivos semiconductores, 281 401,406,408,421,439 ff., 479 ff., 495 ff. Distribución de velocidades 163 ff. Dulong y Petit, ley de, 83, 182, 183 Ecuación de Boltzmann, 204 ff., 308,352 Ecuaciones de continuidad, 350 ff. corriente eléctrica, 44 7-448 electrones y huecos, 350 ff.

Indice 54 5 densidad de portadores en exceso, 354 ff., 3 79 ff., 383 ff., 442 ff., 467 ff., 482 ff. Efecto de campo, experimento de, 523 ff. Efecto de perforación, 454 Efecto de Zeeman, 141 Efecto fotoeléctrico, 81 Efecto fotovoltaico, 495 ff. Efecto túnel, 109, 456 ff., 507 ff., 513 ff. Efectos de campo internos, 352 ff., 423 ff., 479 ff. Efectos galvanomagnéticos, 222 ff. Véase también Ettingshausen, efecto de, Hall efecto de, Nernst, efecto de, Righi-Leduc, efecto de, Efectos inarmónicos, 69, 193 ff., 196 ff. Efectos termoeléctricos, 215 ff. Eficiencia de inyección, 446ff., 467ff., 481ff., 504ff. Eficiencia de rectificación, 445 Einstein, relaciones de, 351ff., 374,486 Einstein, temperatura de, 184 Elementos de simetría, 15 Emisión de campo, 456ff. Emisor, 372-373, 463ff. Energía de Fermi, nivel de Fermi, 170,244,262,423,513ff. gas tridimensional de electrones libres, 171 semiconductores, 285ff. variación con la temperatura,

171 Energía del punto cero, 115 Enlaces covalentes, 27, 283ff., 347 Entropía, 161 Equivalencia cristalográfica, 23ff. Espacio de fase, 147ff., 204ff. Estadística de Bose-Einstein, 1 76ff., 192 Estados superficiales, 5 20ff. rápidos y lentos, 533 Estaño, 23, 28ff., 401 Estructura geométrica, factor de, 41ff. Ettingshausen, efecto de, 224 Exceso de portadores, 347ff. generación de, 34 7, 348ff., 495ff. tiempo de vida, 349ff. recombinación 348ff. Expansión térmica, 193ff.

Factor de amplificación de corriente, 465ff. dependencia de la frecuencia, 471ff. circuito con emisor a tierra, 474 medición, 4 7 5 Factor de dispersión atómica, 3 7 -38ff. Fermi-Dirac, estadística de, 168ff., 212ff., 225ff., 281,289, 426ff., 507ff., 517ff., para niveles de impurezas, 29 5296ff. Flujo de difusión, 351ff., 440ff. Fonones, 191ff., 335ff. Fórmula de Brooks-Herring, 343 Fórmula de Conwell-Weisskopf 343 F otoconductividad, 34 7ff. estado estacionario 3 79ff. transitoria, 383ff., 412ff., 489 Fototransistor, 502 Foto voltaje, 496ff. l'recuencia de ciclotrón, 307, 316ff. Frenkel, defecto de, 418ff. Frontera de grano, 415ff. Frontera lineal de Burgers, 416ff. Fuerzas de Van der Waals, 29-30 Función de densidad de estados, 148ff., 273ff. aleaciones binarias, 273ff. sistema de la partícula libre, 149ff. semiconductor con impurezas, 295ff., 327ff. semiconductor intrínseco, 285, 327ff. teoría cuántica, 273ff. gas ideal bidimensional, 1 70 Función de distribución, 148ff. Bose-Einstein, 175ff. Fermi-Dirac, 168ff. Maxwell-Boltzmann, 159ff. en situaciones de no equilibrio, 204ff. Función de Creen, 3 70 Función de onda, 88ff. estado estacionario o uniforme, 92ff. Función de trabajo, 81,513ff. Funciones de Bloch, 234ff., 249, 256, 267 Funciones propias, 93ff. pares e impares, 108 Gas de electrones libres, 1 70ff., 203ff. conductividad eléctrica, 209ff. capacidad térmica, 191 conductividad térmica, 209ff.

lndice 54 6 Gas de electrones libres de Fermi, 1 70ff., 203ff. degenerado, 172, 587ff. Gas ideal, 161ff. ecuación de estado, 167 Gauss, teorema del flujo eléctrico de, 431,527 Generación térmica, 283ff., 348ff., 375ff., 440ff. Germanio. 281ff., 401ff. Giro (electrón), 141ff. Hall, efecto de, coeficiente de Hall, 222ff., 272, 306-307ff., 326ff., 411 Hall, movilidad de, 315, 334, 412 Haynes-Shockley, experimento de, 371ff., 464ff. Heisenberg, principio de incertidumbre de,99 Hermite, polinomios de, 116 Hipótesis ondulatoria de DeBroglie, 87,94 Huecos, conducción por huecos, 24 7, 269-270ff., 283ff. huecos "ligeros" y "pesados", 307 Impurezas de atrapamiento, 392 Impurezas donadoras, 287ff., 292-293ff., 397 Impurezas receptoras, 287ff., 397 Interacciones electrón-electrón, 219 lrteracciones electrón-fonón, 220, 245, 312ff., 335ff., 459 Interacciones fonón-fonón, 195ff. Inyección de portadores, 371ff., 441, 463ff., 479., 519 ) Irradiación residual (Reststrahlen), 69 Kronig-Penney, modelo de energía potencial de, 235ff., 265, 269, 402,520 Laguerre, ecuación de, 132 Laguerre, polinomios de, 132 Laue, ecuaciones de, 37ff. Legendre, ecuación de, 131 Legendre, polinomios de, 131 Longitud de Debye, 360, 525 Longitud de difusión, 359, 361ff. Madelung, constante de, 73 Magnetorresistencia, 224, 306ff., 333 Masa efectiva, 242ff., 253, 254, 260, 274,285ff.,401 equivalente, de conductividad 331,339 equivalente de la densidad de estados, 327ff., 339

compuestos intermetálicos 111-V, 401 tensor, 260,261,320-312ff. Matrices, mecánica de, 88 Maxwell-Boltzmann, estadística de, 152-153ff., 184, 186, 199, 209ff., 223, 281, 289ff., 351, 376, 393, 425ff., 441ff. Maxwell-Boltzmann, integrales de, 164 Mecánica ondulatoria, 88ff. Metales alcalinos, 29, 271 Metales de transición, 144, 275 Miller, índices de, 23ff. Modos normales, 60 Movilidad, 211, 199, 314ff., 334, 335ff., 351, 371ff., 411, 491ff., 530ff. Movilidad de arrastre, 315, 334, 371ff., 491ff. Movilidades, relación de, 304ff., 401,446,479,482ff. Movilidad superficial, 530ff. Multiplicadores de Lagrange, método de los, 157 Nernst, efecto de, 224 Neutralidad eléctrica, condición de, 354ff., 473, 471, 479ff. Niveles de donadores, 292ff., 397 Niveles cuasi-Fermi, 427ff. Niveles receptores, 292ff., 293 Número de Avogadro, 83,159-160, 167 Número de coordinación, 23 Ohm, ley de, 206ff. Operadores, 88ff. Operador hamiltoniano, 88, 89, 256-257 Ortogonalidad, 119ft, 386 Oscilación de Zener, 245 Oscilador armónico clásico, 83, 181ff. cuántico (unidimensional), lllff., 183ff. Partícula libre, 94ff., 149ff., 203ff., 240-241ff., 284ff., 335ff. Penetración de barrera, 108 Planck, constante de, 80 Planos del cristal, 23ff. Planos del cristal, espaciamiento de, 25ff. Poisson, ecuación de, 353ff., 428ff., 525ff. Potencia termoeléctrica, 217-218 Potencial de contacto, 495, 513ff. Véase también Potencial de contacto interno Potencial de contacto interno, 424ff., 495ff. medición, 436ff. Potencial de deformación, 33 7ff.

Indice 54 7 Pozo de potencial, finito, 103-104ff. infinito, lOOff. parabólico, lllff. Principio de exclusión de Pauli, 142-144, 168-169 Procesos de dispersión, 219-220ff., 335ff. dispersión de impurezas, 221, 340-341ff. dispersión entre valles, 326, 339,340,491 dispersión de red, 221, 245-246, 335ff. efectos de modo óptico, 339ff. Promedios (estadísticos), 149-150, 210-21lff., 303-304ff. Radiación del cuerpo negro, 79 Receptores,divalentes, 397-398 Recombinación, portadores de carga, 348ff., 374ff., 383ff. 390ff., 464-465ff. mecanismos de, 390ff. Recombinación superficial, 374ff., 451ff., 533 Recombinación superficial, velocidad de, 378, 452ff., 533 Rectificador de puntos de contacto, 371ff., 463ff., 517ff. Rectificadores, unión p-n, 439ff. efectos del tamaño y la superficie, 451ff. Red de Bravais, 15 Red del diamante, 22, 282ff. Red recíproca, 43ff., 264ff. Refinamiento de zona, fusión de zona, 402ff. Región de acumulación, 516ff. Región de deficiencia, 515ff. Región de inversión, 516ff. Región de la base, 467ff. Regiones de carga espacial, 422ff., 524ff., Relación, tiempo de, 205ff., 304ff., 335ff., 533 Representación de zona reducida, 243ff., 265ff. Resistencia negativa, 507 Resistividad, mediciones de, 408ff. Véase también Conductividad Resonancia de ciclotrón, 316-317ff. R.ighi-Leduc, efecto de, 224 Ruptura, 441,447,455, 456ff., 507 por avalancha, 456ff. Zener, 456ff., 507 Shockley-Read, teoría de la recombinación de, 390ff., 533 Schottky, defecto de, 418ff.

Schottky, defecto de, 418ff. Schrodinger, ecuación de, 89ff., 233, 248ff., -256, 402 5-256, 402 independiente del tiempo, 92ff. Sección transversal, dispersión, 205, 340ff. Segregación de impurezas, 403ff. Semiconductor, 28, 269-270, 281ff. extrínseco, 299 intrínseco, 283ff. tipo n, 286ff. tipo p, 287ff. Semiconductor extrínseco, 299-300 Semiconductor intrínseco, portadores intrínsecos, 322ff. concentración de portadores, 291 energía de Fermi, 292 Semiconductores con impurezas, 286ff., 295ff. efectos de ionización incompleta, 300ff., 306ff., 343-344 Silicio, 271, 385ff., 401ff. Sistema periódico de los elementos, 142ff. Sistemas cristalinos, 15, 17ff. Sodio, 271 Sólido amorfo. 13 Sólido cristalino, 13 Sulfuro de cadmio, 402 Superficie de Fermi, 173, 262ff. Superficies de energía constante, 155ff. elipsoidales, 307, 316-317ff. Superficies de semiconductores, 51 7ff. Superposición de ondas elásticas, 53-54, 60-61 soluciones de ecuaciones de continuidad, 385, 501 funciones de onda, 95ff., 102, 136, 137,241 haces de rayos X, 36-37ff. Tecnología de materiales, 40 lff. mediciones, 408ff. preparación, 401ff. Temperatura de Debye, 189ff. Tensor, 260-261, 322ff., 537ff. Teorema de Bloch, 232ff. Teoría del electrón libre en los metales, 203ff., 242 Teoría de los átomos de Bohr, 84ff. aplicada a centros de impurezas, 292ff. Thomson, calentamiento de, 217 Thomson, coeficiente de, 217 Tiempo de vida, exceso de portadores. 349ff., 383ff., 402, 418 medición, 412 Tiempo libre medio, 205

Indice 54 8 Véase también Tiempo de relajación Transiciones directas, 390ff. Transiciones indirectas, 390ff. Transistor de efecto de campo, 509 Transistor unipolar, 509 Transistores, 374,446,461, 463ff., 502,509 Trayectoria libre media, 196ff., 209, 457ff. Unión p-n, tecnología de elaboración de la, 459ff. métodos de aleación, 459ff. métodos de difusión, 461ff. técnicas de crecimiento 'de uniones, 459 Uniones p-n, 348, 421ff., 439ff., 479ff., 495ff. abruptas, 421ff., 429-430ff., 460ff. capacitancia, 435ff. graduadas, 42lff., 460ff. vacantes de la red, 418ff. Valores esperados, 89, 92, 94, 123ff., 139,142,257 Valores K, 403ff. efectivos, 404ff. equilibrio,. 403ff. Valores propios 93ff., 387 continuos y discre'tos, 110 Vectores base, 14, 15

Vectores de base primitivos, 15 Velocidad de fase, 52ff. Velocidad de Fermi, 214 Velocidad de grupo, 53ff., 241 Vibraciones de la red, véase Vibraciones elásticas Vibraciones de modo acústico, 64ff. Vibraciones de modo Óptico, 64ff. Vibraciones elásticas, 51ff., 18lff., 191ff., 220, 246-247, 293-294{f., 335ff., 491ff. rama acústica, 63-64ff., 191, 3.12ff., 335ff., 459, 491ff. inarmonía, 69, 193ff: medio continuo, 51ff. red diatómica, 62 regiones de frecuencias prohibidas, 66,67 forzadas, 67ff. red monoatómica, 55ff., 181ff. rama óptica, 64ff., 191, 339ff., Voltajes de polarización (uniones p-n), 425ff. Wiedermann-Franz, relación de, 203, 218ff. Zincblenda, estructura de la, 22, 23, 40lff. Zonas de Brillouin, 60ff., 260ff., 265ff., 319ff.

--oOo--

IMPRESO EN PROGRAMAS EDUCATIVOS, S.A. DE C.V. •

014912,500 08 96 530


Related Documents


More Documents from "Eliana Judith"

January 2021 5
January 2021 2
March 2021 0