¿Qué es el "ruso claro" desde el punto de vista tecnológico? Echemos un vistazo a las métricas de legibilidad del texto. Documento sospechoso al comprobar el trabajo en busca de antiplagio Simple, pero no demasiado simple

Detalles Creado: 12/04/2014 20:02 Actualizado: 10/03/2019 18:32 Publicado: 12/04/2014 20:02

Recientemente, muchos estudiantes se han encontrado con un problema del que me gustaría hablar hoy. Este problema está asociado con la verificación de la singularidad de los trabajos en el servicio más común para verificar el trabajo de los estudiantes en Rusia: el sitio web antiplagiat.ru.

Actualmente, el sitio antiplagiat.ru ha realizado una serie de adiciones, después de las cuales algunos documentos se muestran en el sistema de verificación como "Documentos sospechosos". Parece que el porcentaje de unicidad puede ser alto, pero el archivo se ilumina en rojo y aparece un signo de exclamación junto al título del trabajo, lo que, según los autores de esta innovación, le indica al profesor que algo anda mal con el documento.

Si hace clic en el ícono “Documento sospechoso”, se abrirá información sobre el documento en la que podrá ver el motivo por el cual el sitio reconoce el documento como sospechoso, de hecho hay cuatro:

En realidad, puede haber muchas razones asociadas con esto, pero ¿el maestro realmente se molestará y descubrirá cuál es exactamente la razón de la aparición de este ícono?

Esto es lo que nos dijeron los creadores de este recurso:

“La aparición de este cartel indica que debemos prestar más atención a este documento. Es posible que haya habido intentos de eludir el sistema. Quizás el texto contenga demasiadas palabras extranjeras o palabras cuya longitud promedio se exceda. Esto es posible en obras donde se utilizan muchos términos (obras de química, jurisprudencia, por ejemplo). El informe universitario contiene estadísticas de texto en función de las cuales aparece este signo (índice de legibilidad, longitud máxima de palabras, etc.). La aparición de este cartel y el resaltado del documento sólo le da una señal al profesor para que preste más atención a este texto. Sin embargo, no es un hecho que el trabajo se haya realizado de tal manera que se evite el sistema. La selección de trabajos se realiza en base a ciertos indicadores en las estadísticas del texto, que se pueden ver abriendo el informe en la universidad. Sin embargo, todos estos indicadores no dan una “orden” exacta para rechazar este texto. Simplemente le dan al profesor una razón para estar más atento y serio a la hora de comprobar este trabajo. Si el profesor no sabe esto, puede escribirnos una carta y se lo contamos. El docente no debe centrarse sólo en los porcentajes y la apariencia de este signo; también debe abrir el informe y verlo”.

Esto es lo que escriben las personas que no están satisfechas con esta innovación:

Intentemos ahora descubrir con qué podría estar relacionado esto y cómo solucionarlo, cómo eliminar este "Signo sospechoso" y hacer que nuestro archivo sea normal.

En la mayoría de los casos, esto sucede debido al hecho de que el texto contiene palabras largas, complejas o extranjeras, por ejemplo, "sociometría", "liberalizado", GlobalFinance y otras, que no son reconocidas por el corrector ortográfico automático.

Todas las palabras que Word subraya en rojo están mal escritas. Como muestra la práctica, estas también son palabras que tienen más de 10 letras en general, necesitaremos cambiar todas las palabras muy largas por sinónimos o dividirlas en 2-3 palabras para que al final nuestro texto sea comprensible para la verificación; programa y ya no destaca "Un documento sospechoso."

Entonces, resumamos lo que debemos hacer para que el archivo sea normal y pase la verificación.

  • Índice de legibilidad de Flesch
  • Notas

Índice de legibilidad de Flesch

El compás más popular fue creado por Rudolf Flesch, originalmente para inglés. Estima la complejidad del texto utilizando la siguiente fórmula

F R E = 206,835 − 1,015 palabras en total, oraciones en total − 84, 6 sílabas en total, palabras en total, (\displaystyle FRE=206(,)835-1(,)015(\frac (\text(total de palabras))(\text(total oraciones)))-84(,)6(\frac (\text(total de sílabas))(\text(total de palabras))),)

FRE = 206,835 − 1,015 × ASL − 84,6 × ASW,

ASL: longitud promedio de oración en palabras (longitud promedio de oración en inglés), ASW: longitud promedio de palabra en sílabas (inglés. número promedio de sílabas por palabra).

FRE = 206,835 − 1,3 × ASL − 60,1 × ASW.

En general, la mayoría de los métodos para evaluar la complejidad del texto basados ​​​​en índices de legibilidad de información y documentos analíticos en ruso proporcionan puntuaciones que están fuera tanto del rango interpretable de valores como de los valores de referencia. Al mismo tiempo, los resultados obtenidos se caracterizan por un alto grado de correlación, ya que los desarrolladores utilizan un modelo matemático de regresión lineal, así como parámetros de texto uniformes (longitud promedio de palabras, longitud promedio de oraciones). Sin embargo, los índices de legibilidad no están adaptados a las pruebas para adultos. Un profesional no debería tener dificultades para comprender palabras polisilábicas. En última instancia, el factor de complejidad es la semántica del texto y lo abstracto de su presentación. Los indicadores basados ​​en índices de legibilidad no se interpretan bien porque no pueden usarse directamente para predecir el tiempo de procesamiento de una persona determinada.Índice de legibilidad En general, la mayoría de los métodos para evaluar la complejidad del texto basados ​​​​en índices de legibilidad de información y documentos analíticos en ruso proporcionan puntuaciones que están fuera tanto del rango interpretable de valores como de los valores de referencia. Al mismo tiempo, los resultados obtenidos se caracterizan por un alto grado de correlación, ya que los desarrolladores utilizan un modelo matemático de regresión lineal, así como parámetros de texto uniformes (longitud promedio de palabras, longitud promedio de oraciones). Sin embargo, los índices de legibilidad no están adaptados a las pruebas para adultos. Un profesional no debería tener dificultades para comprender palabras polisilábicas. En última instancia, el factor de complejidad es la semántica del texto y lo abstracto de su presentación. Los indicadores basados ​​en índices de legibilidad no se interpretan bien porque no pueden usarse directamente para predecir el tiempo de procesamiento de una persona determinada.- una medida para determinar la complejidad de la percepción del texto por parte del lector.

Índice de legibilidad de Flesch

Se puede calcular en función de varios parámetros: la longitud de las frases, las palabras, el número específico de palabras más frecuentes (o raras), etc.

El compás más popular fue creado por Rudolf Flesch, originalmente para inglés. Evalúa la complejidad del texto mediante la siguiente fórmula: FRE = 206,835 - 1,015 \left (\frac(\mbox(total de palabras))(\mbox(total de oraciones)) \right) - 84,6 \left (\frac(\mbox(total de sílabas))(\mbox(total de palabras )) \bien)

O:

FRE = 206,835 − (1,015 × ASL) − (84,6 × ASW) índice de escala FRES(Escala de facilidad de lectura de Flesch)

100 distribuido de la siguiente manera: 65 : Muy fácil de leer. La longitud promedio de las oraciones es de 12 palabras o menos. No hay palabras con más de dos sílabas. 30 : Inglés sencillo. La longitud media de las frases es de entre 15 y 20 palabras. En promedio, las palabras tienen 2 sílabas. 0 : Muy difícil de leer. La oración promedio tiene 37 palabras. Una palabra tiene en promedio más de 2 sílabas.

Para ingles un valor de 90-100 corresponde a un texto fácil para niños de primaria, 60-70 a un texto que los graduados de la escuela pueden leer, los textos con un índice de 0 a 30 están destinados a personas con educación superior.

FRE = 206,835 − (1,3 × ASL) − (60,1 × ASW)

En general, la mayoría de los métodos para evaluar la complejidad del texto basados ​​​​en índices de legibilidad de información y documentos analíticos en ruso dan puntuaciones que van más allá tanto del rango de valores interpretados como de los valores de referencia. Al mismo tiempo, los resultados obtenidos se caracterizan por un alto grado de correlación, ya que los desarrolladores utilizan un modelo matemático de regresión lineal, así como parámetros de texto uniformes (longitud promedio de palabras, longitud promedio de oraciones). Sin embargo, los índices de legibilidad no están adaptados a las pruebas para adultos. Un profesional no debería tener dificultades para comprender palabras polisilábicas. En última instancia, el factor de complejidad es la semántica del texto y lo abstracto de su presentación. Los indicadores basados ​​en índices de legibilidad no se interpretan bien porque no pueden usarse directamente para predecir el tiempo de procesamiento de una persona determinada.

Escribe una reseña del artículo "Índice de legibilidad"

Notas

Extracto que describe el índice de legibilidad

Afuera todavía estaba completamente oscuro. La lluvia había pasado, pero aún caían gotas de los árboles. Cerca de la caseta de vigilancia se podían ver figuras negras de chozas cosacas y caballos atados. Detrás de la cabaña había dos carros negros con caballos, y en el barranco el fuego agonizante era rojo. No todos los cosacos y húsares estaban dormidos: en algunos lugares, junto con el sonido de las gotas que caían y el sonido cercano de los caballos masticando, se escuchaban voces suaves, como si susurraran.
Petia salió por la entrada, miró a su alrededor en la oscuridad y se acercó a los carros. Alguien roncaba debajo de los carros y, a su alrededor, había caballos ensillados que masticaban avena. En la oscuridad, Petia reconoció su caballo, al que llamó Karabaj, aunque era un caballo pequeño ruso, y se acercó a él.
"Bueno, Karabaj, serviremos mañana", dijo, oliendo sus fosas nasales y besándola.
- ¿Qué, maestro, no estás durmiendo? - dijo el cosaco sentado debajo del camión.
- No; y... Likhachev, creo que tu nombre es? Después de todo, acabo de llegar. Fuimos a los franceses. - Y Petya le contó al cosaco en detalle no solo su viaje, sino también por qué fue y por qué cree que es mejor arriesgar su vida que hacer a Lazar al azar.
"Bueno, deberían haber dormido", dijo el cosaco.
"No, ya estoy acostumbrado", respondió Petya. - ¿Qué, no tenéis pedernales en vuestras pistolas? Lo traje conmigo. ¿No es necesario? Tómalo.
El cosaco se asomó por debajo del camión para mirar más de cerca a Petia.
"Porque estoy acostumbrado a hacer todo con cuidado", dijo Petya. "Algunas personas simplemente no se preparan y luego se arrepienten". No me gusta así.
"Eso es seguro", dijo el cosaco.
“Y una cosa más, por favor, querida, afila mi sable; lo embotó... (pero Petya tenía miedo de mentir) nunca fue afilado. ¿Se puede hacer esto?
- Vaya, es posible.
Likhachev se levantó, rebuscó entre sus mochilas y Petia pronto oyó el sonido guerrero del acero contra un bloque. Subió al camión y se sentó en el borde. El cosaco afilaba su sable debajo del camión.
- Bueno, ¿están durmiendo los muchachos? - dijo Petia.
- Algunos están durmiendo y otros están así.
- Bueno, ¿qué pasa con el chico?
- ¿Es primavera? Se desplomó allí en la entrada. Duerme con miedo. Me alegré mucho.
Después de esto, Petya permaneció en silencio durante mucho tiempo, escuchando los sonidos. Se escucharon pasos en la oscuridad y apareció una figura negra.
- ¿Qué estás afilando? – preguntó el hombre, acercándose al camión.
- Pero afila el sable del maestro.
“Buen trabajo”, dijo el hombre que a Petya le pareció un húsar. - ¿Todavía tienes una taza?
- Y por allá junto al volante.
El húsar tomó la copa.
“Probablemente pronto amanezca”, dijo bostezando y se fue a alguna parte.
Petya debería haber sabido que estaba en el bosque, en el grupo de Denisov, a una milla de la carretera, que estaba sentado en un carro capturado a los franceses, alrededor del cual estaban atados los caballos, que el cosaco Likhachev estaba sentado debajo de él y afilando. su sable, que había una gran mancha negra a la derecha es una caseta de vigilancia, y una mancha roja brillante debajo a la izquierda es un fuego agonizante, que el hombre que vino por una taza es un húsar que tenía sed; pero él no sabía nada y no quería saberlo. Estaba en un reino mágico en el que no había nada parecido a la realidad. Una gran mancha negra, tal vez definitivamente había una caseta de vigilancia, o tal vez había una cueva que conducía a las profundidades de la tierra. La mancha roja podría haber sido fuego, o tal vez el ojo de un enorme monstruo. Tal vez ahora esté sentado en un carro, pero es muy posible que no esté sentado en un carro, sino en una torre terriblemente alta, desde la cual, si se cayera, volaría al suelo durante un día entero, un Todo el mes: sigue volando y nunca lo alcances. Puede ser que solo haya un cosaco Likhachev sentado debajo del camión, pero es muy posible que se trate de la persona más amable, más valiente, más maravillosa y más excelente del mundo, a quien nadie conoce. Tal vez fue solo un húsar que pasaba en busca de agua y se adentraba en el barranco, o tal vez simplemente desapareció de la vista y desapareció por completo, y no estaba allí.

En el periodismo moderno, el indicador Fog Index se utiliza para determinar el nivel de legibilidad:

Fi = (X + Y) x 0,4,

donde X es el número promedio de palabras en una oración de texto,

Y es el número promedio de palabras con una longitud de tres o más sílabas en una oración de texto (las designaremos como "palabras 3+").

Al contar el número de palabras, considere lo siguiente:

1. no contamos los números, ya que no reducen la percepción;

2. Contamos las palabras complejas separadas por un guión como una sola palabra.

El valor de Fi se estima de la siguiente manera:

· de 0 a 4 – alta legibilidad,

· de 4 a 7 – legibilidad media,

· por encima de 7 – baja legibilidad.

Como ejemplo, analicemos la legibilidad de tres pequeños (para simplificar la tarea) textos publicitarios.

Todo es como en un club de élite. Los caballeros hablan de pasatiempos. Aquí, en un ambiente de lujo y confort, podrá olvidarse de los negocios. Dedica tu tiempo al reloj. Relojes únicos dignos de un verdadero conocedor. Después de todo, Cassaforte es un club de élite.

6 ofertas,

X = 33: 6 = 5,5 ;

Y= 14: 6= 2,33

Fi =(5,5 + 2,33) x 0,4 = 3,13.

Conclusión: la legibilidad es alta.

Analicemos la legibilidad de este texto por niveles. El análisis se presenta en la Tabla 3.2.

Tabla 3.2

Nivel de legibilidad Característica Evaluación de desempeño Puntuación de legibilidad Calificación de nivel general
Léxico 7 (21,2 %) promedio promedio
muchos bajo
alto
pocos alto
Morfológico 1. número de verbos 4 por 33 palabras (12%) alto promedio
4 por 33 palabras (12%) promedio
3. número de afijos promedio promedio
Sintáctico 1. longitud de la oración 5,5 alto alto
2. nivel de dificultad de 6 oraciones – 6 simples (100%) alto
3. elementos complicados 2: 6 ofertas (33%) alto

Conclusión general por nivel: la legibilidad es media.

Como podemos ver, el indicador de legibilidad del Índice de niebla es alto y, por nivel, medio. Esta discrepancia se debe al hecho de que al calcular el índice de niebla solo se tienen en cuenta dos características: la longitud de las palabras y la longitud de las oraciones. El análisis por niveles tiene en cuenta un número mucho mayor de factores. Por tanto, estas dos partes del análisis de legibilidad se complementan.

El diseño brillante te enamorará a primera vista. El poder y la dinámica son fascinantes. La apariencia expresiva y el carácter deportivo son los puntos fuertes de Mazda. Una mirada y tu corazón latirá más rápido. Después de todo, este es un poder místico.



5 ofertas,

X = 32: 5 = 6,4 ;

Y= 9: 5= 1,8;

Fi =(6,4 + 1,8) x 0,4 = 3,28.

Conclusión: la legibilidad es alta.

Analicemos la legibilidad de este texto por niveles. El análisis se presenta en la tabla 3.3.

Tabla 3.3

Nivel de legibilidad Característica Evaluación de desempeño Puntuación de legibilidad Calificación general
Léxico 1. número de palabras largas (4+) 4 (12,5 %) promedio promedio
2. número de palabras abstractas cantidad promedio promedio
3. número de palabras extranjeras alto
4. número de palabras poco utilizadas pocos alto
Morfológico 1. número de verbos 3 por 32 palabras (9,3%) promedio promedio
2. número de preposiciones y partículas 3 por 32 palabras (9.3) alto
3. número de afijos promedio promedio
Sintáctico 1. longitud de la oración 6,4 alto alto
2. nivel de dificultad de 5 frases – 5 simples alto
3. elementos complicados Ofertas 2:5 (40%) promedio


Ley federal de la Federación de Rusia "sobre la protección de la salud de los ciudadanos de los efectos del humo del tabaco ambiental y las consecuencias del consumo de tabaco"

Índice de legibilidad automática/ARI

Este índice determina la legibilidad de la siguiente manera: el número de caracteres se divide por el número de palabras con espacios, luego el número de palabras se divide por el número de oraciones. Según ARI, los textos se presentan en 14 niveles de legibilidad: el primero es accesible para un niño de 6 a 9 años, el último, para un escolar estadounidense de 14 años. Se cree que al momento de graduarse, un graduado debería poder comprender libremente textos del 12º nivel de complejidad.

EL POEMA DE PUSHKIN “MAÑANA DE INVIERNO” ES CLARO PARA LECTORES DE 9 A 11 AÑOS


A.S.Pushkin “Mañana de invierno”

Índice Coleman-Liau

El índice Coleman-Liau, al igual que el ARI, tiene en cuenta el número promedio de caracteres y oraciones por cada 100 palabras de texto. A menudo se utiliza para evaluar grandes volúmenes de texto: para obtener un resultado, no es necesario dividir el texto en sílabas, basta con utilizar un escáner para identificar caracteres individuales y límites de oraciones; En este caso, no se requiere el reconocimiento completo de caracteres.

El texto de Zadornov está destinado a adolescentes de entre 12 y 14 años.


M. Zadornov "No se puede criar a Rusia con la mente"


Medición sencilla
complejidad del texto (Medida simple de galimatías)

Para determinar el índice de legibilidad, cuente la cantidad de oraciones en el texto y la cantidad de “palabras complejas” (más de tres letras) en cada una. El principal inconveniente de la fórmula es que puede obtener un resultado relativamente preciso si el texto tiene más de treinta oraciones.

Herman Melville puede ser leído y comprendido por los niños
9 a 11 años


G. Melville "Moby Dick o la ballena blanca"

Fórmula de legibilidad de Dale - Chall

Inicialmente, el programa se centró en una lista de 763 palabras que todo estudiante estadounidense promedio debe comprender en su último año. Las palabras que no están en esta lista se consideran difíciles de entender. Con el tiempo, la fórmula se perfeccionó y en 1995 la lista de palabras se había ampliado a 3000 palabras.

El texto que acaba de leer es comprensible para un público de entre 15 y 16 años.


El texto que estás leyendo actualmente.




Arriba