Dale click aquí para descargar archivo pdf de este modulo1.
Datos.
1.1. Definición de dato: Un dato es la
representación de una variable que puede ser cuantitativa o cualitativa,
indican un valor que se le asigna a las cosas. Los datos son información. Un
dato por sí solo no puede demostrar demasiado, siempre se evalúa el conjunto
para poder examinar los resultados.
1.2. Dato en información: En informática, los
datos son representaciones simbólicas (vale decir: numéricas, alfabéticas,
algorítmicas, etc.) de un determinado atributo o variable cualitativa o cuantitativa,
o sea: la descripción codificada de un hecho empírico, un suceso, una entidad.
Entonces los datos son, así, la información que recibe el computador a través
de distintos medios, y que se manipula mediante el procesamiento de los
algoritmos de programación.
2. Breve descripción sobre la evolución de la computación en función de los datos: Desde un principio las computadoras y
los datos estuvieron unidos, el propósito para el cual la computación fue
diseñada es crear algoritmos que solucionen problemas y procesar información a
gran escala. La solución de cualquier problema requiere de un procedimiento, un
método, una serie de pasos ordenados para convertir los datos de entrada en
datos de salida deseados (las soluciones).
Tanto
la computación, como la ciencia de información (ciencia encargada de la
recolección, clasificación, uso, almacenamiento de datos procesados), presentan
antecedentes muy antiguos que se pierden en la historia. Sin embargo, ambas
iniciaron su etapa fuerte de progreso durante la década de los años 60. Aun
cuando la ciencia de la información y la computación surgieron como disciplinas
independientes; con gran rapidez, ellas firmaron una alianza indisoluble para
el progreso. Esta unión se debe a que progresivamente a la ciencia de la
información se le dificultaba alcanzar sus objetivos y metas, sobre todo
considerando el crecimiento acelerado del volumen de datos disponibles, así
como el nivel de procesamiento que se proponía sin la existencia de las
computadoras aun cuando sus antecesoras, la bibliotecología y la documentación
de hecho, trataron la información en forma manual y mecánica, es decir, en
forma no automática, durante siglos.
3.
Sistemas de codificación.
3.1. Definición de codificación: La codificación se
puede definir como la asignación de símbolos mediante un plan sistemático, para
distinguir ciertos fenómenos y establecer su ordenamiento dentro de una
clasificación determinada.
3.2. Definición de sistemas de codificación: Los sistemas de
codificación y la necesidad de clasificación surge de la necesidad de
registrar, enmascarar, ordenar, identificar, agrupar y clasificar fenómenos o
elementos o relacionarlo con un grupo determinado, en forma tal que los
elementos codificados puedan ser decodificados tan eficientemente como sea
posible por medio de un índice o guía.
4.
Creación, manejo y verificación de códigos.
4.1. Creación de códigos:
4.1.1. Desarrolle categorías de
codificación, empiece redactando una lista de todos los temas, conceptos e
interpretaciones, tipologías y proposiciones identificados o producidos durante
el análisis inicial.
4.1.2. Codifique todos los datos, codifique
todas las notas de campo, las transcripciones, los documentos y otros
materiales, escribiendo en el margen el número asignado o la letra
correspondiente a cada categoría.
4.1.3. Separe los datos pertenecientes a las
diversas categorías de codificación, el investigador reúne los datos
codificados pertenecientes a cada categoría. …se recortan las notas de campo,
las transcripciones y otros materiales y se colocan los datos de cada categoría
en carpetas de archivo.
4.1.4. Vea que datos han sobrado, algunos
de esos datos probablemente se ajusten a las categorías de codificación
existentes. También se pueden plantear nuevas categorías.
4.1.5. Refine su análisis, la codificación
y separación de los datos permite comparar diferentes fragmentos relacionados
con cada tema, concepto, proposición, etcétera, y en consecuencia refinar y
ajustar las ideas.
Una vez realizada la
codificación de los datos, se puede proceder a la confección de la matriz de
datos. Según Galtung, J. (16): “La matriz
de datos es un modo de ordenar los datos de manera que sea particularmente
visible la forma tripartita.”
En efecto, cada fila
de la matriz corresponde a una unidad de análisis, cada columna a una variable
y en cada celda, figura el valor que cada unidad asume para cada variable. De
esta manera, con la articulación de estos tres elementos se configura una
Matriz de Datos.
4.2. Manejo de códigos: Una vez grabados, los
datos pueden ser transformados para facilitar su análisis. Algunas de las
transformaciones más corrientes consisten en re-codificar variables, definir
nuevas variables a partir de variables existentes, reemplazar los valores
perdidos.
4.3. Verificación de códigos: Utilizar códigos
numéricos para la entrada de datos, no solo facilita la entrada de los mismos,
sino que también facilita la identificación de errores en el proceso.
Existen una forma sencillas de determinar errores en la entrada de datos, cuando los errores se
encuentran fuera del rango de posibles valores. Un tipo de error más difícil de
detectar es el que se encuentra dentro del rango de posibles valores. Por
ejemplo, el género es 1 y usted entra un 2. Sin embargo, como el género puede
ser 1 o 2, el valor entrado, a pesar de ser incorrecto, se encuentra dentro del
rango de posibles valores.
5.
Archivo de datos:
Los archivos como colección de datos sirve para la entrada y salida a la
computadora y son manejados con programas.
Cada archivo es
referenciado por su identificador (su nombre). Los archivos pueden ser
contrastados con Arrays y registros; Lo que resulta dinámico y por esto en
un registro se deben especificar los campos, él número de elementos
de un arrays (o arreglo), el número de caracteres en una cadena; por esto se
denotan como "Estructuras Estáticas".
En los archivos no se
requiere de un tamaño predeterminado; esto significa que se pueden hacer
archivos de datos más grandes o pequeños, según se necesiten.
6. Tipos de archivos según los datos.
6.1. Archivo de Entrada: Una colección de
datos localizados en un dispositivo de entrada.
6.2. Archivo de Salida: Una colección de
información visualizada por la computadora.
6.3. Constantes: están formados por
registros que contienen campos fijos y campos de baja frecuencia de variación
en el tiempo.
6.4. De Situación: son los que en cada
momento contienen información actualizada.
6.5. Históricos: Contienen información
acumulada a lo largo del tiempo de archivos que han sufrido procesos de
actualización, o bien acumulan datos de variación periódica en el tiempo.
6.6. Archivos de Movimiento o
Transacciones:
Son aquellos que se utilizan conjuntamente con los maestros (constantes), y
contienen algún campo común en sus registros con aquellos, para el
procesamiento de las modificaciones experimentado por los mismos.
6.7. Archivos de Maniobra o Transitorios: Son los archivos
auxiliares creados durante la ejecución del programa y borrados habitualmente
al terminar el mismo.
7.
Formas de representación de los datos:
La representación de datos es visualizar a través de diferentes medios escritos
y gráficos los comportamientos de las variables que se estén estudiando.
7.1. Presentación escrita: Esta forma de
presentación de información se usa cuando una serie de datos incluye pocos
valores, por lo cual resulta más apropiada la palabra escrita como forma de
escribir el comportamiento de los datos; mediante la forma escrita, se resalta
la importancia de las informaciones principales.
7.2. Presentación tabular: Cuando los datos
estadísticos se presentan a través de un conjunto de filas y de columnas que
responden a un ordenamiento lógico; es de gran uso e importancia para el
usuario ya que constituye la forma más exacta de presentar las informaciones.
Una tabla consta de varias partes, las principales son las siguientes:
7.2.1. Título: Es la parte más
importante del cuadro y sirve para describir todo el contenido de este.
7.2.2. Encabezados: Son los diferentes
subtítulos que se colocan en la parte superior de cada columna.
7.2.3. Columna matriz: Es la columna
principal del cuadro
7.2.4. Cuerpo: El cuerpo contiene
todas las informaciones numéricas que aparecen en la tabla.
7.2.5. Fuente: La fuente de los
datos contenidos en la tabla indica la procedencia de estos.
7.2.6. Notas al pie: Son usadas para hacer
algunas aclaraciones sobre aspectos que aparecen en la tabla o cuadro y que no
han sido explicados en otras partes.
7.3. Presentación gráfica: Proporciona al lector
o usuario mayor rapidez en la comprensión de los datos, una gráfica es una
expresión artística usada para representar un conjunto de datos.De acuerdo al
tipo de variable que vamos a representar, las principales gráficas son
las siguientes:
7.3.1. Histogramas: Es un conjunto de
barras o rectángulos unidos uno de otro, en razón de que lo utilizamos para
representar variables continuas.
7.3.2. Gráfica de barras: Es un conjunto de
rectángulos o barras separadas una de la otra, en razón de que se usa para
representar variables discretas; las barras deben ser de igual base o ancho y
separadas a igual distancia. Pueden disponerse en forma vertical y horizontal.
7.3.3. Gráfica lineal: Son usadas
principalmente para representar datos clasificados por cantidad o tiempo;
o sea, se usan para representar series de tiempo o cronológicas.
7.3.4. Gráfica circular: se usan especialmente
para representar las partes en que se divide una cantidad total.
8.
Organización de archivos: Los
archivos se encuentran organizados lógicamente como una secuencia de registros
de varias longitudes diferentes.
8.1. Los archivos de registros de longitud
fija: Son
los que almacenan la información en los archivos mediante un encabezado y luego
se introducen uno a uno los registros ubicados en posiciones consecutivas.
8.2. Los registros de longitud variable: Es el almacenamiento
de registros de varios tipos en un archivo y permite uno o más campos de longitudes variables y
dichos campos pueden ser repetidos. La longitud de los registros debe estar
definida correctamente para poder leer y escribir de forma efectiva.
9.
Organización secuencial: Se
refiere al procesamiento de los registros, no importa el orden en que se haga,
para eso los registros están organizados en forma de una lista y recuperarlos y
procesarlos uno por uno de principio a fin.
9.1. Rudimentos de los archivos Secuenciales: Dependiendo del
dispositivo de almacenamiento utilizado el archivo se puede mostrar el usuario
como si fuera un sistema secuencial.
9.1.1. Al finalizar un archivo secuencial se
denota con una marca de fin de archivo. (End end-of-file)
9.1.2. El usuario de un archivo secuencial
puede ver los registros en un orden secuencial simple.
9.1.3. La única forma de recuperar registros es
comenzar al principio y extraerlos en el orden contemplado.
9.2. Cuestiones de programación: La manipulación
de los archivos se hace en el contexto de la programación en un lenguaje
por procedimientos de alto nivel. Estos lenguajes tienden a expresar
la manipulación de archivos mediante subrutinas que se definen como parte del
lenguaje formal o se incluyen como extensiones del lenguaje en
una biblioteca estándar.
La mayor parte de los
lenguajes por procedimiento de alto nivel cuenta con características que ayudan
a detectar la marca de fin de archivo.
10.
Organización y procesos de archivos indexados: Es la aplicación de
incluir índices en el almacenamiento de los archivos; de esta forma nos será
más fácil buscar algún registro sin necesidad de ver todo el archivo.
Un índice en un
archivo consiste en un listado de los valores del campo clave que
ocurren en el archivo, junto con la posición de registro correspondiente en el
almacenamiento masivo.
10.1. Fundamento de los Índices.
10.1.1. La colocación de un listado al inicio del
archivo:
Para la identificación del contenido.
10.1.2. La presentación de un segundo índice: Para reflejar la
información de cada punto principal del índice anterior.
10.1.3. La actualización de los índices: Cuando se insertan y
eliminan archivos, es preciso actualizar los índices para evitar contratiempos
actualizando un archivo.
10.1.4. La organización de un índice: Nos evita examinar
archivo por archivo para recuperar algún registro buscado; por lo tanto
ahorraríamos tiempo si tenemos una adecuado organización de los índices.
10.2. Cuestiones de Programación: Algunos lenguajes de
alto nivel cuentan con subtítulos para manipular los archivos de un registro
indizado.
Valiéndose de las
subrutinas es posible escribir programas sin tener que preocuparse por la
estructura real del sistema de índices que se aplique.
11.
Organización directa: Un
archivo está organizado en modo directo cuando el orden físico no se
corresponde con el orden lógico. Los datos se sitúan en el archivo y se accede
a ellos directa-aleatoriamente mediante su posición, es decir, el lugar
relativo que ocupan.
11.1. Ventajas y desventajas.
11.1.1. Ventaja: esta organización
permite que se puedan leer y escribir los registros en cualquier orden y
posición; además son de muy rápido acceso a la información que contienen.
11.1.2. Desventaja: Esta organización
requiere programar la relación existente entre el contenido de un registro y la
posición que ocupa; además el acceso a los registros en modo directo implica la
posible existencia de huecos libres dentro del soporte y, por consecuencia,
pueden existir huecos libres entre los registros.
11.2. Las condiciones para que un archivo sea
de organización directa son:
11.2.1. Almacenamiento en un soporte
direccionable.
11.2.2. Los registros deben contener un campo
específico denominado clave que identifica a cada registro como único, es
decir, dos registros no pueden tener el mismo valor clave.
11.2.3. Existencia de una correspondencia entre
los posibles valores de la clave y las direcciones posibles sobre el soporte.
En la práctica el
programador no gestiona directamente relaciones absolutas, sino direcciones relativas
respecto al principio del archivo. La manipulación de dirección relativa
permite diseñar el programa con independencia de la posición absoluta del
archivo en el soporte.