miércoles, 17 de junio de 2020

Modulo I: datos y archivos

Contenido general:

1. Datos.

2. Breve descripción sobre la evolución de la computación en función de los datos.

3. Sistemas de codificación.

4. Creación, manejo y verificación de códigos.

5. Archivo de datos

6. Tipos de archivos según los datos

7.Formas de representación de los datos

8.Organización y Proceso de archivo.

9. Organización secuencial.

10. Organización y Proceso de Archivos indexados.

11. Organización directa.

Vídeo del tema a tratar subido a blogger:



Vídeo en youtube por si el anterior falla en abrir y/o es muy lento:

Dale click aquí para descargar archivo pdf de este modulo

1. Datos.

 1.1. Definición de dato: Un dato es la representación de una variable que puede ser cuantitativa o cualitativa, indican un valor que se le asigna a las cosas. Los datos son información. Un dato por sí solo no puede demostrar demasiado, siempre se evalúa el conjunto para poder examinar los resultados.

 1.2. Dato en información: En informática, los datos son representaciones simbólicas (vale decir: numéricas, alfabéticas, algorítmicas, etc.) de un determinado atributo o variable cualitativa o cuantitativa, o sea: la descripción codificada de un hecho empírico, un suceso, una entidad. Entonces los datos son, así, la información que recibe el computador a través de distintos medios, y que se manipula mediante el procesamiento de los algoritmos de programación.

 


2. Breve descripción sobre la evolución de la computación en función de los datos: Desde un principio las computadoras y los datos estuvieron unidos, el propósito para el cual la computación fue diseñada es crear algoritmos que solucionen problemas y procesar información a gran escala. La solución de cualquier problema requiere de un procedimiento, un método, una serie de pasos ordenados para convertir los datos de entrada en datos de salida deseados (las soluciones).

Tanto la computación, como la ciencia de información (ciencia encargada de la recolección, clasificación, uso, almacenamiento de datos procesados), presentan antecedentes muy antiguos que se pierden en la historia. Sin embargo, ambas iniciaron su etapa fuerte de progreso durante la década de los años 60. Aun cuando la ciencia de la información y la computación surgieron como disciplinas independientes; con gran rapidez, ellas firmaron una alianza indisoluble para el progreso. Esta unión se debe a que progresivamente a la ciencia de la información se le dificultaba alcanzar sus objetivos y metas, sobre todo considerando el crecimiento acelerado del volumen de datos disponibles, así como el nivel de procesamiento que se proponía sin la existencia de las computadoras aun cuando sus antecesoras, la bibliotecología y la documentación de hecho, trataron la información en forma manual y mecánica, es decir, en forma no automática, durante siglos.

 

3. Sistemas de codificación.

 3.1. Definición de codificación: La codificación se puede definir como la asignación de símbolos mediante un plan sistemático, para distinguir ciertos fenómenos y establecer su ordenamiento dentro de una clasificación determinada.

 3.2. Definición de sistemas de codificación: Los sistemas de codificación y la necesidad de clasificación surge de la necesidad de registrar, enmascarar, ordenar, identificar, agrupar y clasificar fenómenos o elementos o relacionarlo con un grupo determinado, en forma tal que los elementos codificados puedan ser decodificados tan eficientemente como sea posible por medio de un índice o guía. 

 

4. Creación, manejo y verificación de códigos.


 4.1. Creación de códigos:

  4.1.1. Desarrolle categorías de codificación, empiece redactando una lista de todos los temas, conceptos e interpretaciones, tipologías y proposiciones identificados o producidos durante el análisis inicial.

  4.1.2.  Codifique todos los datos, codifique todas las notas de campo, las transcripciones, los documentos y otros materiales, escribiendo en el margen el número asignado o la letra correspondiente a cada categoría.

  4.1.3. Separe los datos pertenecientes a las diversas categorías de codificación, el investigador reúne los datos codificados pertenecientes a cada categoría. …se recortan las notas de campo, las transcripciones y otros materiales y se colocan los datos de cada categoría en carpetas de archivo.

  4.1.4. Vea que datos han sobrado, algunos de esos datos probablemente se ajusten a las categorías de codificación existentes. También se pueden plantear nuevas categorías.

  4.1.5. Refine su análisis, la codificación y separación de los datos permite comparar diferentes fragmentos relacionados con cada tema, concepto, proposición, etcétera, y en consecuencia refinar y ajustar las ideas.

Una vez realizada la codificación de los datos, se puede proceder a la confección de la matriz de datos. Según Galtung, J. (16): “La matriz de datos es un modo de ordenar los datos de manera que sea particularmente visible la forma tripartita.”

En efecto, cada fila de la matriz corresponde a una unidad de análisis, cada columna a una variable y en cada celda, figura el valor que cada unidad asume para cada variable. De esta manera, con la articulación de estos tres elementos se configura una Matriz de Datos.

 4.2. Manejo de códigos: Una vez grabados, los datos pueden ser transformados para facilitar su análisis. Algunas de las transformaciones más corrientes consisten en re-codificar variables, definir nuevas variables a partir de variables existentes, reemplazar los valores perdidos.

 4.3. Verificación de códigos: Utilizar códigos numéricos para la entrada de datos, no solo facilita la entrada de los mismos, sino que también facilita la identificación de errores en el proceso.

Existen una forma sencillas de determinar errores en la entrada de datos, cuando los errores se encuentran fuera del rango de posibles valores. Un tipo de error más difícil de detectar es el que se encuentra dentro del rango de posibles valores. Por ejemplo, el género es 1 y usted entra un 2. Sin embargo, como el género puede ser 1 o 2, el valor entrado, a pesar de ser incorrecto, se encuentra dentro del rango de posibles valores.


5. Archivo de datos: Los archivos como colección de datos sirve para la entrada y salida a la computadora y son manejados con programas.


Cada archivo es referenciado por su identificador (su nombre). Los archivos pueden ser contrastados con Arrays y registros; Lo que resulta dinámico y por esto en un registro se deben especificar los campos, él número de elementos de un arrays (o arreglo), el número de caracteres en una cadena; por esto se denotan como "Estructuras Estáticas".

En los archivos no se requiere de un tamaño predeterminado; esto significa que se pueden hacer archivos de datos más grandes o pequeños, según se necesiten.

 

6. Tipos de archivos según los datos.

 6.1. Archivo de Entrada: Una colección de datos localizados en un dispositivo de entrada.

 6.2. Archivo de Salida: Una colección de información visualizada por la computadora.

 6.3. Constantes: están formados por registros que contienen campos fijos y campos de baja frecuencia de variación en el tiempo.

 6.4. De Situación: son los que en cada momento contienen información actualizada.

 6.5. Históricos: Contienen información acumulada a lo largo del tiempo de archivos que han sufrido procesos de actualización, o bien acumulan datos de variación periódica en el tiempo.

 6.6. Archivos de Movimiento o Transacciones: Son aquellos que se utilizan conjuntamente con los maestros (constantes), y contienen algún campo común en sus registros con aquellos, para el procesamiento de las modificaciones experimentado por los mismos.

 6.7. Archivos de Maniobra o Transitorios: Son los archivos auxiliares creados durante la ejecución del programa y borrados habitualmente al terminar el mismo.

 

7. Formas de representación de los datos: La representación de datos es visualizar a través de diferentes medios escritos y gráficos los comportamientos de las variables que se estén estudiando.

 7.1. Presentación escrita: Esta forma de presentación de información se usa cuando una serie de datos incluye pocos valores, por lo cual resulta más apropiada la palabra escrita como forma de escribir el comportamiento de los datos; mediante la forma escrita, se resalta la importancia de las informaciones principales.


 7.2. Presentación tabular: Cuando los datos estadísticos se presentan a través de un conjunto de filas y de columnas que responden a un ordenamiento lógico; es de gran uso e importancia para el usuario ya que constituye la forma más exacta de presentar las informaciones. Una tabla consta de varias partes, las principales son las siguientes:


  7.2.1. Título: Es la parte más importante del cuadro y sirve para describir todo el contenido de este.

  7.2.2. Encabezados: Son los diferentes subtítulos que se colocan en la parte superior de cada columna.

  7.2.3. Columna matriz: Es la columna principal del cuadro

  7.2.4. Cuerpo: El cuerpo contiene todas las informaciones numéricas que aparecen en la tabla.

  7.2.5. Fuente: La fuente de los datos contenidos en la tabla indica la procedencia de estos.

  7.2.6. Notas al pie: Son usadas para hacer algunas aclaraciones sobre aspectos que aparecen en la tabla o cuadro y que no han sido explicados en otras partes.

 7.3. Presentación gráfica: Proporciona al lector o usuario mayor rapidez en la comprensión de los datos, una gráfica es una expresión artística usada para representar un conjunto de datos.De acuerdo al tipo de variable que vamos a representar, las principales gráficas son las siguientes:

  7.3.1. Histogramas: Es un conjunto de barras o rectángulos unidos uno de otro, en razón de que lo utilizamos para representar variables continuas.


  7.3.2. Gráfica de barras: Es un conjunto de rectángulos o barras separadas una de la otra, en razón de que se usa para representar variables discretas; las barras deben ser de igual base o ancho y separadas a igual distancia. Pueden disponerse en forma vertical y horizontal.


  7.3.3. Gráfica lineal: Son usadas principalmente para representar datos clasificados por cantidad o tiempo; o sea, se usan para representar series de tiempo o cronológicas.


  7.3.4. Gráfica circular: se usan especialmente para representar las partes en que se divide una cantidad total.

 

8. Organización de archivos: Los archivos se encuentran organizados lógicamente como una secuencia de registros de varias longitudes diferentes.


 8.1. Los archivos de registros de longitud fija: Son los que almacenan la información en los archivos mediante un encabezado y luego se introducen uno a uno los registros ubicados en posiciones consecutivas.

 8.2. Los registros de longitud variable: Es el almacenamiento de registros de varios tipos en un archivo y permite uno o más campos de longitudes variables y dichos campos pueden ser repetidos. La longitud de los registros debe estar definida correctamente para poder leer y escribir de forma efectiva.

 

9. Organización secuencial: Se refiere al procesamiento de los registros, no importa el orden en que se haga, para eso los registros están organizados en forma de una lista y recuperarlos y procesarlos uno por uno de principio a fin.

 9.1. Rudimentos de los archivos Secuenciales: Dependiendo del dispositivo de almacenamiento utilizado el archivo se puede mostrar el usuario como si fuera un sistema secuencial.

  9.1.1. Al finalizar un archivo secuencial se denota con una marca de fin de archivo. (End end-of-file)

  9.1.2. El usuario de un archivo secuencial puede ver los registros en un orden secuencial simple.

  9.1.3. La única forma de recuperar registros es comenzar al principio y extraerlos en el orden contemplado.

 9.2. Cuestiones de programación: La manipulación de los archivos se hace en el contexto de la programación en un lenguaje por procedimientos de alto nivel. Estos lenguajes tienden a expresar la manipulación de archivos mediante subrutinas que se definen como parte del lenguaje formal o se incluyen como extensiones del lenguaje en una biblioteca estándar.

La mayor parte de los lenguajes por procedimiento de alto nivel cuenta con características que ayudan a detectar la marca de fin de archivo.

 

10. Organización y procesos de archivos indexados: Es la aplicación de incluir índices en el almacenamiento de los archivos; de esta forma nos será más fácil buscar algún registro sin necesidad de ver todo el archivo.

Un índice en un archivo consiste en un listado de los valores del campo clave que ocurren en el archivo, junto con la posición de registro correspondiente en el almacenamiento masivo.

 10.1. Fundamento de los Índices.

  10.1.1.  La colocación de un listado al inicio del archivo: Para la identificación del contenido.

  10.1.2.  La presentación de un segundo índice: Para reflejar la información de cada punto principal del índice anterior.

  10.1.3.  La actualización de los índices: Cuando se insertan y eliminan archivos, es preciso actualizar los índices para evitar contratiempos actualizando un archivo.

  10.1.4.  La organización de un índice: Nos evita examinar archivo por archivo para recuperar algún registro buscado; por lo tanto ahorraríamos tiempo si tenemos una adecuado organización de los índices.

 10.2. Cuestiones de Programación: Algunos lenguajes de alto nivel cuentan con subtítulos para manipular los archivos de un registro indizado.

Valiéndose de las subrutinas es posible escribir programas sin tener que preocuparse por la estructura real del sistema de índices que se aplique.

 

11. Organización directa: Un archivo está organizado en modo directo cuando el orden físico no se corresponde con el orden lógico. Los datos se sitúan en el archivo y se accede a ellos directa-aleatoriamente mediante su posición, es decir, el lugar relativo que ocupan.

 11.1. Ventajas y desventajas.

  11.1.1. Ventaja: esta organización permite que se puedan leer y escribir los registros en cualquier orden y posición; además son de muy rápido acceso a la información que contienen.

   11.1.2. Desventaja: Esta organización requiere programar la relación existente entre el contenido de un registro y la posición que ocupa; además el acceso a los registros en modo directo implica la posible existencia de huecos libres dentro del soporte y, por consecuencia, pueden existir huecos libres entre los registros.

 11.2. Las condiciones para que un archivo sea de organización directa son:

  11.2.1. Almacenamiento en un soporte direccionable.

  11.2.2. Los registros deben contener un campo específico denominado clave que identifica a cada registro como único, es decir, dos registros no pueden tener el mismo valor clave.

  11.2.3. Existencia de una correspondencia entre los posibles valores de la clave y las direcciones posibles sobre el soporte.

En la práctica el programador no gestiona directamente relaciones absolutas, sino direcciones relativas respecto al principio del archivo. La manipulación de dirección relativa permite diseñar el programa con independencia de la posición absoluta del archivo en el soporte.

No hay comentarios.:

Publicar un comentario