Manière sémantique de mesurer l'information : essence, concepts de base et propriétés. Algèbre de la logique. Énoncés logiques. Niveaux de problèmes de communication

par état en moyenne est appelé entropie d'une source d'information discrète

mation.

H p i logp i

je 1 N

Si nous nous concentrons à nouveau sur la mesure de l'incertitude en unités binaires, la base du logarithme devrait être prise égale à deux.

H p ilog 2 p i

je 1 N

Dans une élection tout aussi probable, tous

p log

et la formule (5) est transformée en la formule (2) de R. Hartley :

1 log2

N log2

La mesure proposée a été appelée entropie pour une raison. Le fait est que la structure formelle de l'expression (4) coïncide avec l'entropie du système physique, préalablement déterminée par Boltzmann. Selon la deuxième loi de la thermodynamique, l'entropie d'un espace clos est déterminée par l'expression

P je 1

croissance, puis

peut être écrit comme

p iln

je 1 N

Cette formule coïncide complètement avec (4)

Dans les deux cas, la valeur caractérise le degré de diversité du système.

A l'aide des formules (3) et (5), il est possible de déterminer la redondance de l'alphabet de la source du message.

Ce qui montre à quel point les symboles sont utilisés de manière rationnelle de cet alphabet:

) - l'entropie maximale possible, déterminée par la formule (3) ;

() - entropie

source, déterminée par la formule (5).

L'essence de cette mesure réside dans le fait qu'avec un choix équiprobable, la même charge informationnelle sur un signe peut être fournie en utilisant un alphabet plus petit que dans le cas d'un choix inégal.

Mesures d'information au niveau sémantique

Mesurer le contenu sémantique de l'information, c'est-à-dire sa quantité au niveau sémantique, la plus répandue est la mesure du thésaurus, qui relie les propriétés sémantiques de l'information à la capacité de l'utilisateur à recevoir le message. En effet, pour comprendre et utiliser les informations reçues, le destinataire doit disposer d'un certain nombre de connaissances. Une ignorance totale du sujet ne nous permet pas d'extraire des informations utiles du message reçu sur ce sujet. Au fur et à mesure que les connaissances sur le sujet augmentent, la quantité d'informations utiles extraites du message augmente également.

Si les connaissances du destinataire sur un sujet donné sont appelées un "thésaurus" (c'est-à-dire un certain ensemble de mots, de concepts, de noms d'objets reliés par des liens sémantiques), alors la quantité d'informations contenues dans un certain message peut être estimée par le degré de changement dans un thésaurus individuel sous l'influence de ce message ...

Un thésaurus est un ensemble d'informations détenues par un utilisateur ou un système.

En d'autres termes, le nombre informations sémantiques, extraite par le destinataire des messages entrants, dépend du degré de préparation de son thésaurus pour la perception de ces informations.

En fonction de la relation entre le contenu sémantique de l'information et le thésaurus de l'utilisateur, la quantité d'informations sémantiques perçues par l'utilisateur et ensuite incluses par lui dans son thésaurus change. La nature de cette dépendance est illustrée à la figure 3. Considérons deux cas limites où la quantité d'information sémantique est égale à

Figure 3 - Dépendance de la quantité d'informations sémantiques perçues par le consommateur sur son thésaurus ()

Le consommateur acquiert le maximum d'informations sémantiques après accord

combinant son contenu sémantique avec son thésaurus (), lorsque l'information entrante est compréhensible pour l'utilisateur et lui apporte des informations jusque-là inconnues (absentes dans son thésaurus).

Par conséquent, la quantité d'informations sémantiques dans le message, la quantité de nouvelles connaissances reçues par l'utilisateur est une valeur relative. Le même message peut avoir un contenu significatif pour un utilisateur compétent et n'avoir aucun sens pour un utilisateur incompétent.

Lors de l'évaluation de l'aspect sémantique (significatif) de l'information, il est nécessaire de rechercher l'accord des valeurs et.

Une mesure relative de la quantité d'informations sémantiques peut être le coefficient de contenu, qui est défini comme le rapport entre la quantité d'informations sémantiques et son volume :

Une autre approche des évaluations sémantiques de l'information, développée dans le cadre de la science des sciences, est que le nombre de références à celle-ci dans d'autres documents est considéré comme le principal indicateur de la valeur sémantique de l'information contenue dans le document analysé (message, publication) . Des indicateurs spécifiques sont constitués sur la base d'un traitement statistique du nombre de liens dans divers échantillons.

Mesures d'information au niveau pragmatique

Cette mesure détermine l'utilité de l'information (valeur) pour la réalisation de l'objectif de l'utilisateur. C'est aussi une valeur relative, en raison des particularités de l'utilisation de ces informations dans un système particulier.

L'un des premiers scientifiques nationaux à s'attaquer à ce problème était A.A. calculer l'augmentation de la probabilité d'atteindre l'objectif. Donc si

Ainsi, la valeur de l'information est mesurée en unités d'information, ici en bits.

L'expression (7) peut être considérée comme le résultat de la normalisation du nombre de résultats. L'explication de la figure 4 montre trois schémas dans lesquels les mêmes valeurs du nombre de résultats 2 et 6 sont prises pour les points 0 et 1, respectivement. La position de départ est le point 0. Sur la base des informations reçues, une transition est effectuée vers le point 1. La cible est indiquée par une croix. Les résultats favorables sont représentés par des lignes menant à un objectif. Déterminons la valeur des informations reçues dans les trois cas :

a) le nombre de résultats favorables est de trois :

et donc

b) il y a une issue favorable :

c) le nombre de résultats favorables est de quatre :

Dans l'exemple b) une valeur d'information négative (information négative) est obtenue. Une telle information, qui augmente l'incertitude initiale et diminue la probabilité d'atteindre l'objectif, est appelée désinformation. Ainsi, dans l'exemple b), nous avons une désinformation de 1,58 unités binaires.

Mesurer le contenu sémantique de l'information, c'est-à-dire sa quantité au niveau sémantique, la mesure du thésaurus, qui relie les propriétés sémantiques de l'information à la capacité de l'utilisateur à recevoir un message entrant, a reçu la plus grande reconnaissance. Pour cela, le concept est utilisé thésaurus des utilisateurs.

Thésaurus est un ensemble d'informations détenues par un utilisateur ou un système.

Selon la relation entre le contenu sémantique de l'information S et thésaurus des utilisateurs S p la quantité d'informations sémantiques change je c, perçus par l'utilisateur et repris par lui à l'avenir dans son thésaurus. La nature de cette dépendance est illustrée à la figure 2.2. Considérons deux cas limites où la quantité d'informations sémantiques je c est égal à 0 :

à Sp 0 l'utilisateur ne perçoit pas, ne comprend pas les informations entrantes ;

à Sp ; l'utilisateur sait tout, mais il n'a pas besoin des informations entrantes.

Riz. 2.2. Dépendance de la quantité d'informations sémantiques. perçu par le consommateur, à partir de son thésaurus Ic = f (Sp)

Quantité maximale d'informations sémantiques je c le consommateur acquiert en acceptant son contenu sémantique S avec son thésaurus S p (S p = S p opt), lorsque les informations entrantes sont compréhensibles pour l'utilisateur et lui portent des informations précédemment inconnues (absentes dans son thésaurus).

Par conséquent, la quantité d'informations sémantiques dans le message, la quantité de nouvelles connaissances reçues par l'utilisateur est une valeur relative. Un même message peut avoir un contenu sémantique pour un utilisateur compétent et être dépourvu de sens (bruit sémantique) pour un utilisateur incompétent.

Lors de l'évaluation de l'aspect sémantique (contenu) de l'information, il est nécessaire de rechercher l'accord des valeurs S et S p.

Le facteur de contenu peut servir de mesure relative de la quantité d'informations sémantiques AVEC, qui est défini comme le rapport de la quantité d'information sémantique à son volume :

Mesure pragmatique de l'information

Cette mesure détermine l'utilité de l'information (valeur) pour la réalisation de l'objectif de l'utilisateur. Cette mesure est également une valeur relative, en raison des particularités de l'utilisation de cette information dans un système particulier. Il est conseillé de mesurer la valeur de l'information dans les mêmes unités (ou à proximité) dans lesquelles la fonction objectif est mesurée.



Exemple 2.5. Dans un système économique, les propriétés pragmatiques (valeur) de l'information peuvent être déterminées par l'augmentation de l'effet économique du fonctionnement obtenu grâce à l'utilisation de cette information pour gérer le système :

Inb (g) = (g / b) -П (g),

Inb (g)-valeur message d'information b pour le système de contrôle g,

N (g)-effet économique attendu a priori du fonctionnement du système de contrôle g ,

P (g / b)- l'effet attendu du fonctionnement du système g, à condition que l'information contenue dans le message b soit utilisée pour le contrôle.

A titre de comparaison, les mesures d'information introduites sont présentées dans le tableau 2.1.

Tableau 2.1. Unités d'information et exemples

QUALITÉ DES INFORMATIONS

La possibilité et l'efficacité d'utilisation de l'information sont déterminées par son principal consommateur indicateurs de qualité, comme la représentativité, le sens, la suffisance, la disponibilité, la pertinence, l'opportunité, l'exactitude, la fiabilité, la durabilité.

  • Représentativité l'information est associée à l'exactitude de sa sélection et de sa formation afin de refléter de manière adéquate les propriétés de l'objet. Les plus importants ici sont :
  • l'exactitude du concept sur la base duquel le concept original a été formulé;
  • la validité de la sélection des caractéristiques et relations essentielles du phénomène affiché.
  • La violation de la représentativité des informations conduit souvent à des erreurs importantes.
  • Concision l'information reflète la capacité sémantique, égale au rapport entre la quantité d'informations sémantiques dans le message et la quantité de données traitées, c'est-à-dire C = Ic / Vd.

Avec une augmentation du contenu de l'information, la bande passante sémantique du système d'information augmente, car pour obtenir la même information, il faut convertir une plus petite quantité de données.

A côté du coefficient de significativité C, reflétant l'aspect sémantique, il est possible d'utiliser le coefficient de contenu informationnel, qui se caractérise par le rapport de la quantité d'informations syntaxiques (selon Shannon) à la quantité de données Y = I / Vd.

  • Suffisance (exhaustivité) information signifie qu'elle contient une composition minimale (ensemble d'indicateurs), mais suffisante pour prendre une décision correcte. La notion de complétude de l'information est associée à son contenu sémantique (sémantique) et pragmatique. Comme incomplet, c'est-à-dire insuffisante pour prendre une décision correcte, et les informations redondantes réduisent l'efficacité des décisions prises par l'utilisateur.
  • Disponibilité l'information à la perception de l'utilisateur est assurée par la mise en œuvre des procédures appropriées à sa réception et à sa transformation. Par exemple, dans un système d'information, l'information est transformée en une forme accessible et conviviale. Ceci est réalisé notamment en faisant correspondre sa forme sémantique avec le thésaurus de l'utilisateur.
  • Pertinence l'information est déterminée par le degré de conservation de la valeur de l'information pour la gestion au moment de son utilisation et dépend de la dynamique des changements de ses caractéristiques et de l'intervalle de temps qui s'est écoulé depuis l'apparition de cette information.
  • Opportunité information signifie son arrivée au plus tard à un moment prédéterminé, coordonné avec le moment de la résolution du problème.
  • Précision l'information est déterminée par le degré de proximité de l'information reçue avec l'état réel d'un objet, d'un processus, d'un phénomène, etc. Pour les informations affichées par un code numérique, quatre concepts de classification de précision sont connus :
  • précision formelle, mesurée par la valeur de l'unité du chiffre le moins significatif du nombre;
  • exactitude réelle, déterminée par la valeur de l'unité du dernier chiffre du nombre, dont l'exactitude est garantie;
  • la précision maximale pouvant être obtenue dans les conditions spécifiques de fonctionnement du système ;
  • la précision requise, déterminée par l'objectif fonctionnel de l'indicateur.

Crédibilité l'information est déterminée par sa propriété de refléter des objets de la vie réelle avec la précision requise. La fiabilité de l'information est mesurée par le niveau de confiance de la précision requise, c'est-à-dire la probabilité que la valeur du paramètre affiché diffère de la valeur réelle de ce paramètre dans les limites de la précision requise.

Durabilité l'information reflète sa capacité à répondre aux modifications des données d'origine sans violer l'exactitude requise. La stabilité de l'information, ainsi que sa représentativité, est due à la méthode choisie pour sa sélection et sa formation.

En conclusion, il convient de noter que des paramètres de qualité de l'information tels que la représentativité, la signification, la suffisance, la disponibilité, la durabilité, sont entièrement déterminés au niveau méthodologique du développement des systèmes d'information. Les paramètres de pertinence, d'opportunité, d'exactitude et de fiabilité sont déterminés dans une plus large mesure également au niveau méthodologique, cependant, leur valeur est considérablement influencée par la nature du fonctionnement du système, principalement sa fiabilité. Dans le même temps, les paramètres de pertinence et d'exactitude sont strictement liés aux paramètres d'actualité et de fiabilité, respectivement.

Mesurer le contenu sémantique de l'information, c'est-à-dire sa quantité au niveau sémantique, la mesure du thésaurus (proposée par Yu. I. Shreider) a reçu la plus grande reconnaissance, qui relie les propriétés sémantiques de l'information à la capacité de l'utilisateur à recevoir un message entrant. Pour cela, le concept de thésaurus utilisateur est utilisé.

Thésaurus est un ensemble d'informations détenues par un utilisateur ou un système.

Selon la relation entre le contenu sémantique de l'information S et le thésaurus de l'utilisateur S p, la quantité d'information sémantique change 1 C, perçus par l'utilisateur et repris par lui à l'avenir dans son thésaurus. La nature de cette dépendance est illustrée à la Fig. 1.5. Considérons deux cas limites où la quantité d'informations sémantiques 1 C est égal à 0 :

  • lorsque S p -> 0, l'utilisateur ne perçoit pas, ne comprend pas l'information entrante ;
  • pour S p -> 1, l'utilisateur sait tout, et il n'a pas besoin des informations entrantes.

Riz. 1.5.

Le consommateur acquiert le maximum d'informations sémantiques/s en convenant son contenu sémantique S avec son thésaurus S p(S p = S popt), lorsque les informations entrantes sont compréhensibles pour l'utilisateur et lui portent des informations jusque-là inconnues (absentes dans son thésaurus). Par conséquent, la quantité d'informations sémantiques dans le message, la quantité de nouvelles connaissances reçues par l'utilisateur est une valeur relative. Le même message peut avoir un contenu significatif pour un utilisateur compétent et n'avoir aucun sens pour un utilisateur incompétent. Le facteur de contenu C discuté ci-dessus peut servir de mesure relative de la quantité d'informations sémantiques.

L'approche pragmatique (axiologique) de l'information repose sur l'analyse de sa valeur du point de vue du consommateur. Par exemple, une information qui a une valeur incontestable pour un biologiste aura une valeur proche de zéro pour un programmeur. La valeur de l'information est associée au temps, car avec le temps elle vieillit et sa valeur, et, par conséquent, la « quantité » diminue. Ainsi, l'approche pragmatique évalue l'aspect contenu de l'information. Elle est particulièrement importante lors de l'utilisation de l'information pour la gestion, car sa quantité est étroitement liée à l'efficacité de la gestion dans le système.

Mesure pragmatique de l'information détermine l'utilité de l'information (valeur) pour l'utilisateur pour réaliser la chaîne fournie. Cette mesure est également une valeur relative en raison des particularités de l'utilisation de cette information dans un système particulier.

Il est conseillé de mesurer la valeur de l'information dans les mêmes unités (ou à proximité) dans lesquelles la fonction objectif est mesurée.

L'approche algorithmique est associée à la volonté de mettre en œuvre mesure universelle information. Une caractéristique quantitative reflétant la complexité (taille) du programme et permettant la production de n'importe quel message a été proposée par A. N. Kolmogorov.

Puisqu'il existe différentes manières de définir et de mettre en œuvre un algorithme à l'aide de divers ordinateurs et langages de programmation, pour plus de précision, une certaine machine spécifique est donnée, par exemple Machine de Turing. Dans ce cas, comme caractéristique quantitative du message, on peut prendre le nombre minimum d'états internes de la machine nécessaires pour reproduire le message donné.

Différentes approches pour évaluer la quantité d'information obligent, d'une part, à utiliser différents types d'unités d'information pour caractériser différents processus d'information, et d'autre part, relier ces unités entre elles à la fois sur une logique et sur niveaux physiques... Par exemple, le processus de transfert d'informations mesurées dans certaines unités est couplé au processus de stockage d'informations, où elles sont mesurées dans d'autres unités, etc., et donc le choix d'une unité d'informations est une tâche très urgente.

Tableau 1.3 les mesures d'information introduites sont comparées.

Tableau 1.3

Comparaison des mesures de l'information

La quantité d'informations est mesurée par le nombre de caractères (bits) dans le message. Dans différents systèmes de calcul, un chiffre a un poids différent et l'unité de mesure des données change en conséquence. Par exemple, le message "10111011" dans un système binaire a la quantité de données un = 8 bits, et en décimal - V = 8 enfants.

Mesurer le contenu de l'information, c'est-à-dire sa quantité au niveau sémantique, la plus grande reconnaissance a été donnée au degré de thésaurus, qui relie les propriétés sémantiques de l'information avec la capacité de l'utilisateur à percevoir le message qui est venu. Thésaurus est un ensemble d'ouvrages de référence utilisés par l'utilisateur IP

Mesure pragmatique de l'information - la valeur de l'information pour la réalisation de l'objectif par l'utilisateur. Cette mesure est une valeur relative, en raison des particularités de l'utilisation de l'information dans un SI particulier.

La valeur de l'information est déterminée par sa quantité nécessaire pour atteindre l'objectif fixé par l'utilisateur.

Si avant la réception de l'information la probabilité d'atteindre l'objectif est égale à P g, et après l'avoir reçue - P 2, alors la valeur de l'information est déterminée par la formule Yn (G, / G 2) pour Claude Shannon.

Une méthode pour déterminer la probabilité d'une mesure de la valeur de l'information pour atteindre un objectif a été proposée par M. Bongart et A. Kharkevich. Cela peut être formulé comme suit : si la réalisation de l'objectif est probable et que la valeur de cette probabilité est connue avant d'obtenir des informations, ainsi qu'après avoir reçu des informations, alors la mesure de la valeur des informations peut être déterminée par la formule

B = osh 2 (G / g),

V - une mesure de la valeur de l'information ; g - la probabilité d'atteindre l'objectif avant de recevoir l'information ; P est la probabilité d'atteindre l'objectif après avoir reçu des informations.

La valeur de l'information est toujours associée à son destinataire spécifique, à un objectif spécifique qu'il souhaite réaliser et à des possibilités spécifiques pour réaliser cet objectif.

Il convient de noter de telles propriétés de l'information à travers son cycle de vie reproductif : la capacité d'accumuler, de généraliser, de systématiser, de copier, de coder, de cibler, etc. (fig. 1.1).

Riz. 1.1. Le cycle de vie de l'information à travers la fourniture de services en société de l'information

Listons quelques propriétés de l'information : exhaustivité, fiabilité, valeur, adéquation, pertinence, clarté, accessibilité, inépuisable, cumulatif, compréhensibilité, subjectivité.

L'exhaustivité des informations caractérise la qualité de l'information et détermine la suffisance des données pour la prise de décision. La notion de complétude de l'information est associée à son contenu (sémantique) et à sa pragmatique. Comme incomplet, c'est-à-dire insuffisant pour prendre la bonne décision, et les informations redondantes réduisent l'efficacité des décisions prises par l'utilisateur.

La forme est également un facteur important pour refléter l'information. Les produits d'information sont présentés sous une forme typique de certaines industries, sociétés et divisions.

Fiabilité des informations - sa propriété de refléter des objets réels avec la précision requise. La fiabilité de l'information est mesurée par la probabilité que la valeur d'un paramètre affiché par l'information diffère de la vraie valeur de ce paramètre dans la précision requise. Une information inexacte est caractérisée par un bruit d'information, et plus il est élevé, plus la fiabilité de l'information est faible.

La valeur des informations ne peut pas être abstrait. Les informations doivent être utiles et précieuses pour une catégorie spécifique d'utilisateurs. La valeur de l'information dépend des tâches qui peuvent être résolues avec son aide.

Adéquation des informations caractérise le degré de correspondance des informations avec les réalités. Une information adéquate est une information complète et fiable.

Pertinence des informations - le degré de conservation de la valeur de l'information pour la gestion au moment de son utilisation et dépend de la dynamique d'évolution de ses caractéristiques et de l'intervalle de temps qui s'est écoulé depuis l'émergence de certaines informations. La pertinence est essentielle lorsque l'on travaille dans un environnement en constante évolution. La soumission en temps opportun d'informations dans n'importe quel domaine de l'activité humaine est un moment critique, car au cours d'une certaine période, elle peut perdre de sa valeur. Chaque niveau produit ses propres produits d'information associés à certains intervalles de temps.

Actualité des informations - son arrivée au plus tard à une heure prédéterminée, convenue avec l'heure de résolution du problème posé à l'utilisateur. Par exemple, pour la comptabilité, il s'agit des rapports opérationnels quotidiens, mensuels, trimestriels et annuels.

Clarté des informations - l'information doit être compréhensible pour la personne à qui elle est destinée.

Disponibilité des informations est la capacité de recevoir et de transformer l'information. Cette propriété de l'information est influencée à la fois par la disponibilité des données et la possibilité d'appliquer des méthodes adéquates. Par exemple, dans un système d'information, l'information est transformée en une forme accessible et conviviale. Ceci est réalisé notamment en faisant correspondre sa forme sémantique avec le thésaurus de l'utilisateur.

Exactitude des informations - le degré de similitude des informations reçues avec l'état réel d'un objet, d'un processus, d'un phénomène, etc. Distinguer : l'exactitude formelle, mesurée par la valeur de l'unité du chiffre le moins significatif du nombre ; la précision réelle, qui est due à la valeur de l'unité du dernier chiffre du nombre ; précision maximale, qui peuvent être obtenus dans les conditions particulières de fonctionnement du système ; la précision requise, qui est due à l'objectif fonctionnel de l'indicateur.

Subjectivité de l'information. L'information est de nature subjective, puisque sa valeur est déterminée par le degré de perception du sujet (destinataire de l'information).

Information utile - une propriété qui réduit l'incertitude de la prise de décision.

Qualité est une caractéristique des produits d'information. L'efficacité de l'utilisation de l'information prédétermine la représentativité, la signification, la suffisance, la pertinence, l'actualité, l'exactitude, la fiabilité, la durabilité.

Représentativité des informations - l'exactitude de sa sélection et de sa formation pour refléter de manière adéquate les propriétés de l'objet. Les plus importants ici sont : la justesse du concept sur la base duquel le concept initial a été formulé ; la validité de la sélection des caractéristiques et relations essentielles du phénomène affiché. La violation de la représentativité des informations conduit souvent à des erreurs importantes.

Parallèlement au coefficient de signification, reflétant l'aspect sémantique, il est possible d'utiliser le coefficient de contenu informationnel, qui se caractérise par le rapport entre la quantité d'informations syntaxiques et la quantité de données.

Persistance des informations - sa capacité à réagir aux modifications des données d'origine sans violer la précision requise. La stabilité de l'information, ainsi que sa représentativité, est associée au mode de sélection et de formation choisi. La pertinence, l'actualité, l'exactitude et la fiabilité des informations affectent d'autres paramètres du fonctionnement du SI, notamment tels que sa fiabilité.

Le concept d'information, de données, de connaissances liées. Dans de nombreuses situations, une compréhension et une interprétation intuitives de ces catégories sont souvent suffisantes. La complexité de la définition formelle des termes « information », « données », « connaissance » réside dans l'usage général de ces termes. Une autre raison de confusion terminologique est le fait que la frontière entre ces termes pour la plupart des spécialistes est plutôt arbitraire.

Données - ce sont des descriptions élémentaires d'objets, d'événements, d'actions et de transactions, mémorisables, classés et stockés, mais non organisés de quelque manière que ce soit.

Information sont des données organisées de manière à avoir une certaine signification et une certaine valeur pour l'utilisateur.

Connaissance Se compose de données ou d'informations, organisées et traitées pour transmettre certaines idées, leçons apprises, résultats d'apprentissage et expertise d'une manière qui peut être utilisée pour résoudre des problèmes ou prendre des mesures.

Les données peuvent être considérées comme un concept de base. Une tentative de définition des concepts de base conduit à la nécessité de définir en plus les termes utilisés.

Données - ce sont des informations, des indicateurs nécessaires pour se familiariser avec quelqu'un, quelque chose, pour caractériser quelqu'un - quelque chose pour certaines conclusions et décisions; leurs relations, phrases et faits, à travers la transformation et le traitement desquels il est possible d'obtenir des informations sur des objets, des processus ou des phénomènes.

Au sens large, les données sont des faits, du texte, des graphiques, des images, des sons, du matériel analogique ou vidéo. Ils peuvent être obtenus à la suite de mesures, d'expériences, d'opérations arithmétiques et logiques. Les données doivent être présentées sous une forme adaptée au stockage, à la transmission et au traitement. Ils sont la matière première pour créer de l'information.

Les données sont divisées en structuré, non structuré, distribué. Ainsi, les données sont des matières premières fournies par les fournisseurs de données et utilisées par les consommateurs pour générer des informations à partir des données.

Du point de vue du code du programme, les données sont une partie, un ensemble de valeurs de certaines cellules mémoire, dont la transformation est effectuée par le code. Contrôler l'accès aux données dans moderne les calculateurs électroniques (ECM) sont réalisés en hardware. Selon le principe de von Neumann, une même zone de mémoire informatique peut faire office de données et de code exécutable.

Les données sont présentées dans un ordinateur personnel sous forme de fichiers, qui sont de deux types - binaire (binaire) et texte; les binaires sont traités par un logiciel spécialisé et les textes sont traités par un logiciel standard.

Le modèle de données dans les technologies et les systèmes d'information est un moyen de présenter l'information dans les systèmes d'information, les méthodes et les technologies de traitement de l'information. Un modèle de données dans les langages de programmation est défini comme des structures de données, des contraintes d'intégrité et des opérations de manipulation de données.

Un modèle de données dans des bases de données (DB) est un ensemble de méthodes et d'outils pour déterminer la structure logique d'une base de données et la modélisation dynamique des états d'un domaine (SbA) dans une base de données.

Traditionnellement, les structures de données sont considérées comme des connaissances déclaratives qui reflètent O. Une séquence ordonnée d'opérations peut être effectuée sur des structures de données - un programme qui implémente un certain algorithme. Le résultat du travail du programme est toujours une connaissance déclarative, et le programme lui-même - une connaissance procédurale. Le type de données est concept abstrait, qui est déterminé par un ensemble de possibilités logiques. Une fois le type de données abstrait et les opérations associées définis, vous pouvez implémenter ce type de données. La mise en œuvre peut être matérielle, lorsque des circuits électroniques spéciaux sont développés pour effectuer les opérations nécessaires, ce qui fait partie de l'ordinateur lui-même. Ou il peut s'agir d'une implémentation logicielle, dans laquelle un programme composé d'instructions matérielles existantes interprète les chaînes de bits de la manière requise. Une implémentation logicielle comprend une spécification de la manière dont un objet avec un nouveau type de données est représenté par des objets de types de données déjà existants, ainsi qu'une spécification de la manière dont, à l'aide des opérations définies pour un tel objet, le travail avec lui est effectué.

La transition des données à la connaissance est une conséquence du développement et de la complication des structures logiques de l'information, qui sont traitées sur un ordinateur.

La connaissance est une forme d'existence et de systématisation des résultats de l'activité cognitive humaine. Il s'agit d'une image subjective de la réalité objective, c'est-à-dire reflet du monde extérieur dans l'activité humaine, dans les formes de sa conscience et de sa volonté. Les connaissances peuvent varier au niveau de la présentation (concrète et abstraite) et du niveau de détail des données, être complètes ou incomplètes, fiables ou non fiables.

Connaissance - ce sont les régularités de la matière (principes, relations, lois), obtenues grâce à pratiquement « l'activité et expérience professionnelle qui permettent aux spécialistes de résoudre les problèmes du domaine.

Domaine (O) est cette partie de la réalité qui suscite un intérêt particulier chez une personne et se démarque de l'image générale de la réalité objective environnante.

Le concept de « connaissance » a les significations suivantes : 1) compréhension acquise par l'expérience réelle ; 2) l'état de conscience d'une possession particulière d'informations, l'étendue de la conscience ; 3) l'acte de comprendre : une perception claire de la vérité ; 4) ce qui peut être compris et gardé à l'esprit (Webster Encyclopedic Dictionary). Il y a un intérêt considérable pour l'accumulation de connaissances et les technologies d'automatisation analyse intellectuelle informations afin d'identifier de nouvelles connaissances. La preuve en est, en particulier, les tentatives de suivre les concepts de "société de l'information", d'introduire les termes "gestion de la connaissance", "économie de la connaissance".

La ressource la plus importante d'une entreprise moderne qui peut affecter de manière significative l'augmentation de sa compétitivité est la connaissance de l'entreprise. Le savoir devient un facteur de production important avec les ressources, le capital et le travail.

Aujourd'hui, nous sommes entourés d'énormes volumes d'informations. Le nombre de flux d'informations ne cesse d'augmenter, mais nous nous trouvons dans l'incapacité de les utiliser. La connaissance prend différentes formes et devient donc plus difficile à gérer.

Il convient de noter la différence entre les connaissances implicites et explicites. Connaissance implicite (ils sont difficiles à définir) ne sont souvent pas formalisés et ne se prêtent pas à l'analyse, ne contribuent pas à l'accumulation d'expérience, de compétences, etc. La connaissance tacite peut être possédée par une personne ou un groupe de personnes. Connaissances explicites utiliser des algorithmes clairs avec des données, des messages, des mots et des nombres appropriés.

La connaissance de l'entreprise est divisée en externe et interne. Le premier groupe comprend, par exemple, la connaissance client (connaissance la plus importante pour la plupart des entreprises), les informations analytiques indépendantes (rapports et notations marketing, cours sur les bourses internationales, dynamique d'évolution des indices boursiers américains, etc.).

Le deuxième groupe comprend les connaissances sur les principaux processus

Acquérir la meilleure expérience dans l'exécution de tâches de base ; sur les biens/services ; des solutions optimales répondant aux besoins actuels des utilisateurs ; connaissances des employés

Identification, accumulation et utilisation du capital intellectuel ; expérience existante; des connaissances personnelles qui garantissent une coopération fructueuse ; actifs intellectuels (bases de connaissances)

Expérience en gestion de projet (exemples de bonnes pratiques).

Gestion des connaissances est un ensemble de processus associés à la création, la distribution, le traitement et l'utilisation des connaissances. Il s'agit d'une technologie pour rechercher et obtenir de nouvelles connaissances, leurs supports, les structurer, les systématiser, les diffuser et les générer. Il ne s'agit pas d'un produit logiciel séparé, mais d'une stratégie globale de gestion de l'état, de la région, de l'entreprise, de l'orino-van pour une utilisation maximale de son potentiel intellectuel.

Gestion des connaissances (KM)

Il s'agit d'une stratégie d'entreprise dont le but est d'identifier toutes les informations utiles qui se trouvent dans l'entreprise, d'étudier l'expérience et d'améliorer les compétences des employés afin d'améliorer la qualité du service client et de réduire le temps de réaction à la dynamique du marché. KM est une procédure d'entreprise formelle pour travailler avec des ressources d'information pour faciliter l'accès à la connaissance et sa réutilisation à l'aide des TIC modernes. Dans ce cas, les connaissances sont classées et catégorisées conformément à l'ontologie des bases de données et bases de connaissances structurées et semi-structurées. L'objectif principal du KM est de rendre les connaissances disponibles et réutilisables dans toute l'entreprise.

Les ressources de connaissances varient selon l'industrie et l'application, mais elles incluent traditionnellement des manuels, des lettres, des actualités, des informations sur les clients, des informations sur les concurrents et des données de fabrication.

Diverses technologies sont utilisées pour appliquer les systèmes de KM : e-mail ; bases de données et entrepôts de données ; systèmes de soutien de groupe; systèmes de recherche d'informations; réseaux d'entreprise et Internet; systèmes experts et systèmes de base de connaissances; systèmes intelligents, etc. Dans les systèmes intelligence artificielle Les bases de connaissances sont générées pour les experts et les systèmes basés sur les connaissances dans lesquels les ordinateurs utilisent des règles d'inférence pour répondre aux questions des utilisateurs.

Traditionnellement, les développeurs de systèmes de KM se concentraient uniquement sur certains groupes de consommateurs, en particulier les gestionnaires qui travaillent avec les systèmes d'information exécutifs. Les systèmes modernes de gestion des connaissances sont axés sur le soutien au fonctionnement des entreprises.

Les entreprises s'orientent désormais vers l'utilisation d'entrepôts de données afin que tous les employés puissent utiliser les informations distribuées pour leurs connaissances.

Les entrepôts de données sont discutés en détail dans la section 7. Ils diffèrent des bases de données traditionnelles en ce qu'ils sont conçus pour soutenir les processus de prise de décision, et non pour collecter et traiter efficacement les données. À condition que toutes les données soient stockées dans un référentiel unique, l'étude des relations entre les éléments de données individuels peut être précise et le résultat de l'analyse est de nouvelles connaissances. Une approche alternative, appelée intelligence des connaissances, est utilisée pour rechercher dans les données des connaissances supplémentaires qui s'y cachent.

Alors que les entrepôts de données contiennent principalement des données quantitatives, les entrepôts de connaissances se concentrent principalement sur des données qualitatives. Les systèmes de gestion des connaissances génèrent des connaissances sur un large éventail de bases de données, de magasins de données, de processus métier, d'articles de presse, de bases de données externes, de pages Web, etc. Ainsi, les magasins de connaissances sont similaires aux entrepôts virtuels, où les connaissances sont réparties sur un grand nombre de serveurs.

Les connaissances peuvent être extraites de processus métier, d'enquêtes et d'autres sources. Les bases de connaissances (KB) peuvent être conçues dans l'attente de maintenir la chronologie de l'entreprise, en ce qui concerne, par exemple, le travail avec les clients. Les bases de connaissances peuvent être utilisées pour soutenir les opérations ou générer des informations sur l'entreprise dans son ensemble. Les bases de connaissances des solutions optimales accumulent des connaissances en utilisant divers tests dans la recherche de moyens efficaces de résoudre des problèmes. Une fois que l'organisation a acquis la connaissance de la meilleure solution, l'accès peut être mis à la disposition des employés de l'entreprise.

Connaissances en renseignement est un nouveau domaine qui évolue rapidement et utilise les méthodes de l'intelligence artificielle, des mathématiques et des statistiques pour acquérir des connaissances à partir d'entrepôts de données. G. Pyatetsky-Shapiro et V. Froley définissent le terme « exploration des connaissances » comme une acquisition non triviale d'informations précises, auparavant inconnues et potentiellement utiles à partir de données. Cette méthode comprend l'instrumentation et diverses approches pour analyser les données textuelles et numériques.

L'objectif principal des systèmes d'intelligence des connaissances est de s'éloigner de la méthode traditionnelle de prise de décision intuitive basée sur une gestion incomplète de l'information, basée sur la connaissance.

L'intelligence des connaissances dans les conditions modernes est réalisée pour atteindre deux objectifs - réduire les risques et assurer la sécurité des opérations, ainsi que gagner des avantages concurrentiels. Le système moderne d'intelligence des connaissances permet non seulement de surveiller les informations, mais également de simuler la stratégie des concurrents, d'identifier leurs partenaires, fournisseurs et de connaître les termes de la coopération.

Les principales tâches des systèmes d'intelligence des connaissances sont de trouver et de résumer des informations sur les concurrents, les marchés, les produits, les tendances de développement commercial, etc. Par exemple, le système Odie (On demand Information Extractor) scanne en permanence près d'un millier d'articles avec les dernières actualités pour prendre connaissance des évolutions de la gestion. Il est également possible d'utiliser la fonction de suivi du texte structuré pour collecter des informations sur d'autres types d'événements liés à l'entreprise.

L'une des directions les plus importantes et les plus prometteuses dans le domaine de la formalisation des connaissances, qui permet d'utiliser les connaissances accumulées pour le traitement informatique, sont les ontologies, discutées au chapitre 9.

Les tâches des systèmes de gestion des connaissances (KMS) sont d'accumuler des connaissances structurées et formalisées : des modèles et des principes qui aident à résoudre des problèmes de production réels. L'objectif principal de KMS est de rendre les connaissances disponibles et réutilisables dans l'ensemble de l'entreprise. Fonctions du KMS : 1) collecte de connaissances ; 2) stockage et traitement des connaissances ; 3) livraison de connaissances. L'ontologie est une description précise de la conceptualisation. Dans un KMS d'entreprise, les spécifications ontologiques peuvent faire référence à une taxonomie de tâches qui définissent les connaissances pour le système. L'ontologie forme un vocabulaire qui est partagé à travers le KMS pour faciliter la communication, la mémorisation et la présentation. Développer et maintenir une ontologie à l'échelle de l'entreprise nécessite des efforts continus pour la faire évoluer. L'ontologie, en particulier, est nécessaire pour que l'utilisateur puisse travailler avec des bases de données de solutions optimales qui se rapportent à un large éventail de problèmes d'entreprise, et reconnaître quelle solution peut lui être utile dans une situation particulière. Étant donné que les entreprises prennent en charge différents types d'activités, il est nécessaire d'utiliser plusieurs ontologies pour un seul KMS. Pour les entreprises multinationales, l'ontologie doit être traduite dans différentes langues afin que les informations stockées dans les bases de connaissances soient accessibles à tous les salariés. Au fil du temps, les industries viendront à des équipes collaboratives ou à des formes d'abonnement à la maintenance centralisée d'une ontologie commune. En plus de l'ontologie, des attributs descriptifs supplémentaires sont d'une grande importance pour l'utilisation des connaissances. Des exemples d'attributs descriptifs sont l'employé, l'entreprise, le statut de l'information. En théorie, toutes les bases de connaissances stockent des informations sur un contact ou un employé, y compris le nom, la date du contact et le rôle de la personne de contact dans la génération de connaissances. De nombreuses bases de connaissances stockent des informations organisationnelles, telles que des rapports sur le service qui a développé un projet ou rassemblé des connaissances. Le statut de l'information est également un attribut descriptif typique et peut inclure, par exemple, le statut d'un élément particulier : planifié, utilisé aujourd'hui ou obsolète. Il peut également s'agir d'un enregistrement indiquant que les informations sont à usage interne uniquement ou qu'elles peuvent être diffusées à l'extérieur de l'organisation.

La qualité et la pertinence des connaissances dépendent de nombreux facteurs, par exemple, qui fournit les connaissances au système. Comme la qualité des connaissances varie d'une source à l'autre, les systèmes sélectionnent souvent les connaissances pour qu'elles soient complètes et fiables.

Filtration n'est pas toujours effectuée par les employés de l'entreprise. Filtrage des messages le plus couramment utilisé E-mail par priorités et catégories. De plus, divers outils sont utilisés pour surveiller la qualité des bases de données. Habituellement, l'évaluation dépend des besoins d'employés spécifiques, de groupes de travail ou des intérêts de l'ensemble de l'entreprise.

Les bases de connaissances contiennent souvent une énorme quantité d'informations, alors recherchez les informations dont vous avez besoin devient une fonction extrêmement critique. La plupart des méthodes de recherche modernes incluent des outils, des outils de recherche intelligents et des modèles visuels.

Un large éventail d'outils de recherche bien connus (Google, AltaVista, Excite, Infoseek, Lycos, WebCrawler, Yahoo!) sont utilisés pour la navigation des informations sur Internet. Tous peuvent être adaptés aux besoins internes lorsque l'on travaille avec des systèmes de gestion des connaissances.

À l'aide d'outils de recherche intelligents, vous pouvez trouver les données dont vous avez besoin dans l'environnement d'information d'Internet ou des réseaux d'entreprise. Par exemple, InfoFinder examine les intérêts des utilisateurs avec des ensembles de messages ou de documents classés par eux.

Sur la base de la syntaxe des messages, InfoFinder essaie de déterminer Expressions-clés qui aident à comprendre les tâches de l'utilisateur. Parmi les nouvelles tendances dans la conception de systèmes de recherche pour des systèmes de gestion des connaissances efficaces, on peut distinguer la méthode des modèles visuels. Deux boîtes à outils - Perspecta et InXight - représentent différentes méthodes de visualisation des connaissances.

Perspecta crée un contexte intellectuel en utilisant des méta-informations extraites de documents sources, y compris des informations structurées dans des bases de données et des documents, ou des données non structurées dans des documents bureautiques et des pages Web,

Pour les documents non structurés, Perspecta dispose d'un moteur d'analyse de documents dédié qui effectue une analyse linguistique et balise automatiquement les documents. Le serveur de contexte intelligent analyse les informations vues, identifie les relations entre les documents et construit un espace d'informations multidimensionnel à l'aide d'un langage de balisage d'espace d'informations spécial. Pour conserver les ressources, les données sont téléchargées vers le client à l'aide du protocole de transport d'informations en continu, qui est une extension de HTTP.

InXight Software a publié son propre outil de visualisation, VizControl, qui propose plusieurs formats de visualisation. Chacun d'eux développe une méthode focus-contexte. Les données sont affichées et en même temps la structure des grands ensembles de données est préservée.

Le fonctionnement des systèmes de gestion des connaissances nécessite culture de l'information partager ses connaissances.

En utilisant des systèmes de gestion des connaissances, les entreprises sont en mesure d'assurer leur propre compétitivité, ce qui simplifie la réutilisation des connaissances existantes et permet de créer de nouvelles connaissances afin de prendre des décisions de qualité.

Pour créer un KMS, les entreprises utilisent des technologies et des systèmes tels que des bases de connaissances et des entrepôts de données, des systèmes intelligents de recherche d'informations, des systèmes d'acquisition de données, des systèmes experts, etc. Un exemple d'utilisation d'un KMS dans une entreprise est un système de support de service client pour les gestionnaires - un système de gestion des relations. CMS fournit des connaissances à la fois sous une forme qui convient à notre perception et sous forme numérique. Dans le premier cas, les connaissances sont accessibles à l'aide de navigateurs et de systèmes de recherche intelligents. Mais parfois, les connaissances disponibles au format machine peuvent être conçues comme des bases de connaissances de systèmes experts pour soutenir la prise de décision.

Modèle de représentation des connaissances (MPZ) est un système de formalismes (concepts et règles), selon lequel le système d'information fournit des connaissances dans la mémoire de l'ordinateur et effectue des opérations sur celles-ci. Les IPM sont divisés en logique (inductif, calcul des prédicats, etc.) et heuristique (réseau, trames et production).

MPZ peut être grossièrement divisé en conceptuel et empirique. Le modèle conceptuel utilise une méthode heuristique pour résoudre un problème. Il permet de reconnaître le problème, réduit le temps de son analyse préalable. L'utilisation pratique du modèle conceptuel oblige à le transformer en modèle empirique. Les connaissances peuvent être accumulées sous forme de modèles empiriques, généralement de nature descriptive. Ces modèles peuvent aller d'un simple ensemble de règles à description complète comment le décideur résout le problème.

MPZ nécessaire pour créer des langages spéciaux pour décrire les connaissances et les manipuler, formaliser des procédures de comparaison de nouvelles connaissances avec celles existantes, pour formaliser des mécanismes pour la conclusion logique de nouvelles connaissances à partir de celles existantes.

Knowledge About contient une description des sujets, de leur environnement et de la relation entre eux. La connaissance est définie comme les lois fondamentales qui permettent à une personne de résoudre des problèmes spécifiques de production, scientifiques et autres problèmes socio-économiques, c'est-à-dire faits, concepts, relations, évaluations, règles, connaissances factuelles et stratégies de prise de décision. Le 1C traditionnel inclut les connaissances algorithmiques contenues dans les programmes. Ces connaissances font partie intégrante des programmes et sont introduites à l'avance par les développeurs de programmes.

MPZ est souvent contradictoire, incomplète et floue et nécessite une formalisation, qui est réalisée en utilisant une logique significative, une théorie des ensembles flous, des méthodes probabilistes et statistiques.

La nécessité d'améliorer l'efficacité du fonctionnement des entreprises, l'amélioration des systèmes de gestion ont conduit à la prise de conscience que les valeurs d'une organisation ne sont pas seulement ses actifs, ses produits, ses biens, mais aussi ses connaissances, son expérience, les qualifications de ses employés, culturel, c'est-à-dire tout ce qui est inclus dans le concept de "capital intellectuel".

Le groupe Gartner estime que la gestion des connaissances est un processus commercial de gestion des actifs intellectuels d'une entreprise (figure 1.2) qui est lié à la stratégie d'entreprise ; exige une culture et une discipline organisationnelles qui soutiennent le partage des connaissances, la collaboration entre les spécialistes et les départements et stimulent l'innovation ; devrait contribuer à l'amélioration des processus commerciaux et à l'optimisation des processus de production.

Riz. 1.2. Types de fonctions de connaissance dans KMS

La capacité d'utiliser et de développer efficacement les connaissances, de les traduire en nouveaux produits et services se transforme en facteur important compétitivité de l'entreprise dans la société de l'information.

La gestion des connaissances fournit une approche intégrée de la création, de la collecte, de l'organisation et de l'utilisation des ressources d'information d'entreprise et de l'accès à celles-ci. Ces ressources incluent DB, BZ, documents électroniques décrivant les règles et procédures pour le fonctionnement des processus commerciaux, les connaissances et l'expérience explicites des employés.

La gestion des connaissances dans une entreprise consiste à évaluer les procédures organisationnelles, les personnes, les ressources et la technologie et à créer des systèmes d'information spécialisés.

Le KM comprend l'objectif de gestion, les objectifs tactiques (résoudre les tâches actuelles de l'entreprise), les objectifs stratégiques (augmenter le potentiel intellectuel de l'entreprise et son développement durable) et la méthodologie de gestion, d'obtention et de diffusion des connaissances.

Aujourd'hui, le coût de la plupart des produits et services est principalement influencé par les « actifs incorporels », c'est-à-dire ceux qui sont fondés sur la connaissance. Les experts se réfèrent aux « valeurs intangibles » comme des informations, des processus commerciaux, des capacités personnelles de spécialistes, etc.

Les actifs intellectuels d'une entreprise augmentent sa compétitivité et sa valeur marchande. Une entreprise doit non seulement protéger ses brevets, droits d'auteur, mais aussi identifier et protéger les connaissances de ses spécialistes, connaissances de la production de biens/services, acheteurs, concurrents, etc.

Dans le processus de gestion des connaissances, les fonctions suivantes sont distinguées: création - une fonction dont le résultat est de nouvelles connaissances ou des modifications de connaissances existantes; identification - une fonction qui transforme les connaissances implicites en connaissances explicites, c'est-à-dire transforme les connaissances individuelles en connaissances publiques ; l'organisation - la fonction de classification et de catégorisation des connaissances pour la navigation, la mémorisation, la recherche et la maintenance des connaissances ; accéder - la fonction de transfert et de diffusion des connaissances entre utilisateurs ; usage - la fonction d'application des connaissances pour la prise de décision.

Les principales composantes de la gestion des connaissances sont les personnes qui reçoivent, génèrent et transmettent les connaissances ; processus ce qui est utilisé pour diffuser les connaissances; systèmes et technologies de l'information assurer le fonctionnement efficace des personnes et des processus.

Technologies CPS de base : outils le travail d'équipe de personnes, tels que les logiciels et les systèmes de gestion de documents (groupware, workflow) ; systèmes basés sur la connaissance (raisonnement basé sur des cas); systèmes de recherche, d'analyse et de navigation des connaissances; des systèmes qui assurent l'interaction de la VD et de la base de connaissances au moyen d'une interface en langage naturel.

Les principaux composants du CPS comprennent : l'architecture du CPS ; moyens de communication entre utilisateurs et bases de données ; système de recherche de documents; un système d'élaboration et de prise de décision ; un système d'obtention de connaissances à partir de données ; systèmes experts qui combinent tous les composants ci-dessus dans un système de gestion des connaissances.

Une tâche importante pour les entreprises est la gestion synchrone des connaissances sur les indicateurs micro et macroéconomiques. Les connaissances qui doivent être représentées dans le système économique peuvent refléter : la structure, la forme, les propriétés, les fonctions et les états possibles des sous-systèmes de production et de distribution ; les relations entre les sujets de l'activité économique, les événements possibles auxquels ils peuvent participer ; lois et réglementations économiques; effets possibles des actions et des états, causes et conditions d'occurrence des événements et états à risque ; intentions possibles, objectifs, plans, accords, etc.

L'importance du niveau de développement intellectuel de la population et de la profondeur des connaissances du pays est soulignée par l'introduction de l'ONU au début des années 90 de l'indice de développement humain, où, avec l'espérance de vie et le PIB par habitant, le niveau de l'éducation de la population est introduite.

De ce point de vue, la connaissance est un ensemble complet d'informations pour la solution directe d'un problème par des spécialistes. La connaissance est la capacité d'organiser un processus et de l'orienter vers la réalisation d'un objectif défini.

Propriétés de la connaissance : interprétabilité - la possibilité de leur interprétation, qui n'est réalisée que par le travail de programmes avec ces données ; la structuration - décomposition objets complexes sur les plus simples et établir des liens entre les objets de classification ; connectivité - la capacité de reproduire les lois des faits, des phénomènes et des relations de cause à effet entre eux ; compatibilité situationnelle des connaissances; activité - la connaissance assure l'utilisation à bon escient des informations (l'incomplétude des connaissances prédétermine leur renouvellement).

L'information et la connaissance sont l'une des ressources les plus précieuses de la société. Le rôle des ressources d'information en tant que ressource importante développement de la production, l'esprit d'entreprise se développera, car ils permettent une augmentation de l'efficacité de la gestion stratégique, tactique et opérationnelle basée sur l'utilisation des dernières technologies.

Ressources d'information. Les ressources d'information réduisent les besoins en terres, en main-d'œuvre et en capital, réduisent la consommation de matières premières et d'énergie et sont utilisées pour développer de nouveaux types de production.

Les ressources d'information comprennent des documents individuels et des ensembles de documents, des documents dans des systèmes d'information (bibliothèques, archives, fonds, banques de données, bases de connaissances et autres systèmes d'information). Les ressources informationnelles sont des objets de relations entre les individus, les personnes morales et l'État.

Les ressources d'information sur support informatique sont des ensembles d'informations spécialisés sous forme de bases de données automatisées, ainsi que des ressources d'information de sites Web sur Internet.

Les ressources d'information peuvent être étatiques et non étatiques et, en tant qu'élément de propriété, peuvent appartenir à des citoyens, des autorités étatiques, des gouvernements locaux, des entreprises. Vous pouvez considérer les ressources d'information d'un individu, d'un département, d'une entreprise, d'un pays, d'une société internationale, etc.

(IP) est une information qui a une certaine valeur et peut être utilisée par une personne dans une activité économique pour atteindre un certain objectif.

Disponibilité des ressources d'information - Il s'agit du degré de disponibilité des données et des modalités de leur traitement. La constance d'une ressource d'information reflète sa capacité à réagir aux changements des données initiales sans violer la précision requise.

Adéquation de la ressource d'information - c'est le degré de conformité avec la réalité. Des informations inadéquates peuvent être générées lors de la création nouvelle information sur la base de données incomplètes ou inexactes.

La justesse de la prise de décision par le consommateur d'informations dépend de la mesure dans laquelle ces informations sont adéquates à l'état réel de l'objet. Contrairement aux ressources associées aux éléments matériels, les ressources informationnelles sont inépuisables et impliquent diverses méthodes de récupération.

Dans l'économie de l'information, les ressources informationnelles sont la principale source de valeur ajoutée.

Il existe un certain nombre de caractéristiques qui distinguent les ressources d'information des autres types de ressources, à savoir : elles n'ont pas d'usure physique ; intrinsèquement intangible; leur utilisation permet de réduire fortement la consommation d'autres types de ressources, ce qui conduit à leurs économies; le processus de leur création et de leur utilisation est réalisé à l'aide des TIC.

Les particularités des RI devraient inclure le fait qu'elles affectent l'efficacité de la production sans augmenter physiquement les ressources traditionnelles, accélèrent le processus de reproduction en réduisant les périodes de production et de circulation.

La définition de la propriété intellectuelle est contenue dans la loi ukrainienne "sur le programme national d'informatisation", selon laquelle "une ressource d'information est un ensemble de documents dans les systèmes d'information (bibliothèques, archives, banques de données, etc.)".

Cependant, cette définition ne couvre pas l'ensemble du spectre des RI. Considérant les RI comme une composante de l'infrastructure de l'information, il convient de noter que cette définition est vague, car il n'en ressort pas clairement quels documents sont en cause et y font référence, en particulier, les connaissances humaines qui peuvent affecter les processus métier et ne sont pas documenté de quelque manière que ce soit.

il existe une autre opinion (A.V. Oleynik, A.V. Sosnin, L. Ye. Nimansky) : « ce sont des documents et des ensembles de documents séparés, les résultats d'activités intellectuelles, créatives et informationnelles, des bases de données et des banques de données, tous types d'archives, bibliothèques, les fonds des musées et autres contenant des informations et des connaissances enregistrées sur les supports appropriés "sont des objets de propriété de tous les sujets de l'Ukraine et ont une valeur de consommation (politique, économique, socio-culturelle, militaire, historique, marchande, * informationnelle).

Ressource d'information - une collection organisée d'informations documentées, y compris des bases de données et des connaissances, des stockages de données, des fichiers dans des systèmes d'information (bibliothèques, archives, documents de bureau, etc.). Il s'agit de publications manuscrites, imprimées et électroniques contenant des informations normatives, administratives, managériales et autres sur divers domaines de l'activité publique (législation, politique, sphère sociale, etc.).

Il n'est pas toujours possible de déterminer sans ambiguïté la taille optimale des IR requis et leur prix marginal, respectivement, les ratios habituels des coûts marginaux d'obtention de l'information et du bénéfice marginal de son utilisation.

Au niveau macro, la valeur de l'information augmente avec le nombre d'agents économiques impliqués dans son utilisation. Dans ce cas, le prix peut augmenter, en raison d'une augmentation de la demande effective d'informations.

Il y a la R&D organisationnelle, scientifique et technique, économique, marketing, sociale, environnementale, etc. Un enjeu important dans le développement de la théorie des RI est la méthode de leur mesure, le développement de critères d'efficacité et l'optimisation de leur utilisation.

Classification des ressources d'information. Sur une base territoriale, les PI suivants seront distingués : internationaux - mondiaux, qui n'ont pas de frontières territoriales ; national - sont utilisés sur le territoire d'un État distinct et lui appartiennent; régional - utilisé dans la région; local (local, entreprises, organisations) - en raison des spécificités de l'organisation du système pour la formation, le stockage et l'utilisation des ressources d'information dans les systèmes d'information distribués.

A. Khoroshilov, S. Seletkov, les ressources d'information mondiales sont réparties comme suit : informations d'affaires; scientifique et technique et informations spécialisées; information de masse pour les consommateurs. Les informations commerciales sont subdivisées en les types suivants: bor zhova et informations financières cotations de titres, taux de change, pourcentages de remise, le marché des biens et des capitaux, assuré par les bourses, les services spéciaux d'échange et d'information financière, les sociétés de courtage, etc. information statistique - des informations numériques, économiques, démographiques, sociales sous forme de séries de dynamiques, de modèles prédictifs et d'estimations fournies par les services publics, ainsi que par les organismes engagés dans la recherche, le développement et le conseil ; informations commerciales sur les entreprises, les entreprises, les sociétés, les domaines de leur travail, la situation financière, les prix des produits et services, les communications, les opérations, les gestionnaires ; nouvelles commerciales dans le domaine de l'économie et des affaires.

Du fait que les informations boursières et financières sont en constante évolution, elles doivent être fournies en temps réel. La fourniture d'informations boursières et financières devrait être plus rapide que les informations commerciales. La valeur des informations commerciales dans un environnement de marché et de concurrence est également très importante. Ces informations sont utilisées directement par les entrepreneurs pour résoudre les tâches suivantes : sélection de fournisseurs, de partenaires et passation de commandes ; entrer sur le marché avec un nouveau produit; recherche d'acheteurs; fusions et acquisitions d'entreprises; étude de marché analyse des marchés.

Les informations scientifiques, techniques et spéciales comprennent des informations bibliographiques documentaires, des résumés et des textes intégraux sur la recherche fondamentale et appliquée, ainsi que des informations professionnelles pour les avocats, les médecins, les ingénieurs, etc.

Les organisations qui opèrent sur le marché des services d'information offrent aux consommateurs divers types de services, à savoir :

a) l'accès à des bases de données thématiques, y compris professionnelles, et des stockages de données en modes interactif et périodique ;

b) bases de données sur support dur - disquettes et CD ;

c) les consultations sont assurées par des spécialistes dans le domaine des ressources informationnelles ;

d) formation à l'accès aux ressources d'information, etc. Les fournisseurs de PI sont des structures commerciales,

les organisations étatiques et publiques, les particuliers, qui sont représentés par des sociétés d'information, des agences, des services, des centres, des sites spécialisés.

Par exemple, les éléments suivants peuvent servir de centres d'information : des centres où les bases de données sont créées et stockées, et où les informations sont constamment accumulées et modifiées ; centres de diffusion d'informations à partir de différentes bases de données ; services de télécommunication et de transmission de données; services spéciaux qui reçoivent des informations sur un domaine d'activité spécifique pour son analyse, sa généralisation, sa prévision, par exemple, les cabinets de conseil, les banques, les bourses ; entreprises commerciales; courtiers en informations, etc.

L'Internet mondial est aujourd'hui une puissante source de propriété intellectuelle. Selon les méthodes de présentation de l'information, les types de sources d'information suivants sur Internet peuvent être distingués :

1) Sites Internet (portails), où les utilisateurs ont accès à des ressources d'information via des liens vers des pages Web ;

2) téléconférences - une source d'information importante ; ils sont divisés en sections sur un sujet spécifique;

3) bases de données ou magasins de données, - couvrir de puissants volumes d'informations diverses ;

Selon la forme de propriété, les ressources informationnelles sont :

1) nationale - les ressources, quels que soient leur contenu, leur forme, leur époque et leur lieu de création, forme de propriété, destinées à répondre aux besoins d'un citoyen, d'une société, d'un État, comprenant à leur tour :

2) Etat - objet des droits de propriété de l'Etat ;

3) communautaire - objet du droit de propriété communale ;

4) privé - un objet de droits de propriété privée.

Selon les possibilités d'utilisation, les ressources d'information sont :

1) jetable - utilisé dès réception dans un délai court pour une décision unique ;

2) utilisation permanente - acheté une fois et réutilisé ;

3) périodique - arrivent après un certain temps et ne sont utilisés qu'une seule fois.

Les IR uniques sont utilisées pour résoudre une tâche spécifique dans un laps de temps limité, leur création peut donc nécessiter un financement supplémentaire. Par exemple, les informations sur l'état du marché au moment de la sortie d'un nouveau produit peuvent être générées par les spécialistes de l'entreprise, ou elles peuvent être achetées auprès d'une entreprise spécialisée, mais ces informations ne seront utilisées qu'à un moment donné pour décider sur les conditions d'entrée sur le marché pendant la période déterminée.

Dans le processus d'organisation de la sphère de traitement des IR périodiques, il convient de tenir compte du fait que sur la base des IR primaires, une grande quantité d'informations analytiques est formée, ce qui est nécessaire à la prise de décision par les gestionnaires de divers domaines fonctionnels du tout. niveaux de gestion.

En ce qui concerne les systèmes de contrôle, l'information est : entrée - reçue de l'extérieur ; jour de congé - fourni par l'entreprise à l'environnement ; interne - est produit et utilisé au sein de l'entreprise, du département.

La tâche principale de ce critère de classification est la répartition des rôles pour la création et la gestion des RR et des flux d'informations.

Selon les étapes du cycle de vie de la R&D, il existe :

mais) en cours de développement - caractérisé haut niveau les coûts de fonctionnement;

b) primaire - distribué pour la première fois, dans un certain délai, caractérisé par un prix élevé dû aux coûts de développement ;

dans) répliqué - sont utilisés pour la redistribution, se caractérisent par un faible coût de réalisation des copies, les caractéristiques fonctionnelles des ressources d'information déterminent le niveau des prix ;

G) archives - sont stockés et utilisés de manière irrégulière dans le processus de production.

Ce critère de classification acquiert une pertinence particulière dans les conditions où la RI est un produit d'information.

Produit d'information - information documentée préparée conformément aux besoins des utilisateurs et présentée sous la forme d'un produit. Les produits d'information sont des produits logiciels, des bases de données et des banques de données, etc. Le produit du système d'information est l'IR, qui se caractérise par certaines des caractéristiques d'un produit matériel classique.

L'étape du cycle de vie du produit détermine les coûts matériels et temporels de sa production, l'étendue des travaux, l'effet possible de l'utilisation à un moment donné, l'état du système de production. À chaque étape du cycle de vie de la R&D, des approches individuelles de gestion sont requises.

Selon le degré de pragmatisme, ils se répartissent en : obligatoires - ressources, sans lesquelles il est impossible de prendre une décision ; souhaitable - contribuer à améliorer la qualité des décisions prises, en réduisant le niveau d'incertitude ; excessif - n'affecte pas de manière significative la décision prise ou rend difficile la prise de décision pour une quantité excessive d'informations. Un excès d'IR entraîne une diminution de l'efficacité de leur utilisation.

L'influence croissante des TIC sur l'activité économique des entreprises a conduit à la création de divisions dans les entreprises ukrainiennes, dont les fonctions incluent la gestion des flux d'informations à la fois au sein de l'organisation et à l'extérieur de celle-ci - des départements informatiques (soutien d'information et d'analyse), dont le rôle augmentera.

Au prix de l'obtention de l'IR sont : payé - exiger des investissements ciblés de fonds ; libre - reçu comme produit auxiliaire des activités de l'entreprise ou distribué gratuitement.

Cette caractéristique de classification est due à la nécessité de gérer le financement de la création, de la fourniture et de l'utilisation de la R&D ; une attention particulière doit être portée à la question de la valeur de l'information.

Selon la méthode d'obtention de la propriété intellectuelle, il existe: spécialisée - leur réception est planifiée à l'avance; peut être commandé auprès d'organisations ou de divisions tierces de l'entreprise et reçu pendant une certaine période; auxiliaire (non spécialisé) - obtenu en tant que produit supplémentaire dans le cadre de l'activité économique de l'entreprise ou de l'environnement; leur réception est prévue à l'avance et est effectuée volontairement en fonction des besoins ; Aléatoire - leur réception n'est pas attendue ou planifiée à l'avance.

l'implication dans le sujet de la gestion de la R&D est: fonctionnelle - dont la formation, le traitement et l'utilisation sont supposés être une liste de travaux exécutés conformément aux caractéristiques de performance ; aditionellement - dont la formation, le traitement et l'utilisation sont censés être une liste de travaux exécutés conformément à des caractéristiques de performance supplémentaires.

Les deux derniers critères caractérisent les RI compte tenu de leur création et visent à mettre en évidence les informations principales et secondaires, compte tenu des ressources dépensées pour sa réception.

Derrière la réflexion sur les supports matériels de l'IR il y a l'électronique ; sur support dur (papier, disquette, disquette, clés USB, etc.) ; traditionnel. Des recherches sont menées avec des types de supports fondamentalement nouveaux : holographiques, moléculaires, cristallographiques, etc. Les technologies de communication se développent très rapidement, conçues pour transmettre divers types d'informations (données, son, image) reçues de divers médias par le biais de canaux intégrés.

Selon le mode d'utilisation des RI, il y a : à usage restreint, dont la valeur croît avec le pouvoir de monopole ; pour un usage général, ajoutent de la valeur au fur et à mesure qu'ils sont distribués.

Selon la loi de l'Ukraine sur l'information (art. 53), « les ressources d'information de l'Ukraine comprennent toutes les informations qui lui appartiennent, quels que soient le contenu, la forme, l'heure et le lieu de création », la forme de propriété, conçue pour répondre aux besoins d'un citoyen, d'une société, d'un État (Fig. 1.3).

IR déposé avec l'aide de medias ELECTRONIQUES, acquièrent un état qualitativement nouveau, deviennent disponibles pour la reproduction opérationnelle des informations nécessaires et deviennent le facteur le plus important du développement socio-économique de la société.

La formation des RI et leur utilisation systématique deviennent l'objet d'intérêts politiques et économiques tant au niveau national qu'international. Des fonds énormes sont alloués chaque année pour le développement de technologies pour soutenir la R&D.

Il est nécessaire de déterminer les problèmes de fourniture de ressources d'information pour la gestion des processus économiques, la sécurité nationale, les sphères sociales et socio-politiques. Les ressources informationnelles dans la gestion des processus économiques couvrent : le niveau national, le niveau sectoriel, le niveau régional, le niveau des entités économiques. Les tâches et les objectifs de gestion à chacun des niveaux déterminent la composition et la portée de la R&D requise et les modalités de leur utilisation.

niveau national la gestion résout les problèmes de suivi, d'analyse et de prévision macroéconomiques ; assurer la sécurité économique; contrôle sur les activités des autorités étatiques, régionales et locales. Le suivi de l'activité économique des entreprises nécessite un accès rapide à la propriété intellectuelle appropriée. Le système de contrôle des activités des organes de gestion étatiques, locaux et sectoriels fournit une analyse de la qualité de l'exercice des fonctions qui leur sont assignées, de l'utilisation des fonds budgétaires et de l'identification des violations.

niveau sectoriel gestion, les tâches consistant à assurer le progrès scientifique et technologique, l'augmentation de la productivité du travail, la qualité des produits et l'augmentation de la production sont résolues. Les types de R&D scientifiques et techniques, marketing et réglementaires et de référence apportent des solutions à ces problèmes.

niveau régional la gestion et les exigences en matière de ressources d'information sont similaires à la tâche du niveau national.

IR la sécurité nationale doit prévenir de telles menaces à la sécurité nationale : crises dans des secteurs importants de l'économie (énergie, transports, système bancaire, etc.) ; les difficultés sociales causées par la montée du chômage et la baisse du niveau de vie ; l'arrivée au pouvoir de groupes criminels ; transfert d'une part importante des ressources nationales sous le contrôle de capitaux étrangers ; la destruction de la science et de la culture nationales, une baisse du niveau éducatif et culturel de la population, la propagation de l'idéologie de la violence, divers mouvements religieux sectaires ; sortie de ressources financières, intellectuelles et informationnelles à l'étranger; faillite au niveau de l'État causée par une forte augmentation de la dette intérieure et extérieure; perte d'intérêts stratégiques sur la scène internationale.

Les ressources informationnelles dans la gestion des sphères sociales et socio-politiques devraient assurer la solution des tâches suivantes :

1) régulation sociale et réduction de la stratification sociale et des tensions dans la société ;

2) protection sociale de la population (pension, assurance sociale, assurance contre le chômage, assurance contre les accidents du travail) ;

3) analyse et gestion de l'opinion publique ;

4) protection de l'espace d'information commun national ;

5) développement du niveau culturel et éducatif de la population. La principale ressource du système social, ce sont les gens. Le principal

le but de la ressource d'information dans ce domaine est de fournir une protection sociale, et le niveau culturel, éducatif et politique de la population est également nécessaire pour le développement de la société. Les principales sources d'information sur l'état de la RI humaine sont : les données d'inscription individuelle au système d'assurance sociale de l'État ; données de recensement; enquête par sondage auprès des ménages; sondages d'opinion; les données sociales (le niveau de consommation, de revenu et d'épargne par catégories de population, les indices des prix à la consommation, le coût de la vie, le coût du panier de consommation).

L'étude de l'essence des RI au niveau macro permet de systématiser leurs principales propriétés, qui comprennent : la facilité de réplication et de distribution ; pertinence; pas de restrictions quantitatives ; fixation; vimiryuvanstvo; immuabilité pendant l'utilisation; efficacité (la capacité de réaliser des changements importants); représentativité; sens; adéquation; opportunité; précision; fiabilité; la structuration ; cohérence, etc.

Les ressources d'information au niveau micro sont comprises comme des informations précieuses pour une entreprise et valorisées comme les autres ressources matérielles. Si nous considérons la propriété intellectuelle au niveau micro, alors elles sont un produit direct de l'activité intellectuelle de la partie qualifiée de la population en âge de travailler du pays.

En d'autres termes, les IR sont identifiés, en fait, avec l'ensemble informations utiles C'est elle produit par la société ou Communauté globale.

La base de la R&D intellectuelle est le résultat de l'activité créative, de la recherche scientifique et du développement de la conception expérimentale (R&D), qui permettent de créer des produits à forte intensité scientifique, d'utiliser des idées techniques et scientifiques enregistrées dans divers documents et publications. Les IR actifs sont distingués comme une partie spéciale, c'est-à-dire informations disponibles pour la recherche, le stockage, le traitement automatisés (programmes, bases de données, bases de connaissances, magasins de données, documents, etc.) et pour un usage général.

L'efficacité de l'utilisation des IR est déterminée par le rapport entre leur partie active et le volume total des ressources d'information.

Dans la société de l'information, la RI est considérée comme un facteur important de changements qualitatifs dans la vie de la société. Parallèlement, tout à fait en accord avec les réalités de la civilisation moderne, deux options d'exploitation des ressources informationnelles se distinguent : d'une part, l'utilisation de l'informatisation dans l'industrie et la sphère sociale, et d'autre part, la transition aux méthodes post-industrielles hautement organisées de mise en œuvre des processus d'information eux-mêmes.

Mesure syntaxique de l'information

En tant que mesure syntaxique, la quantité d'informations représente la quantité de données.

O taille des données V d dans le message "in", le nombre de caractères (bits) de ce message est mesuré. Comme nous l'avons mentionné, dans le système binaire, l'unité de mesure est le bit. En pratique, avec cette "plus petite" unité de mesure de données, une unité plus grande est souvent utilisée - octet égal à 8 bits... Pour plus de commodité, kilo- (10 3), méga- (10 6), giga- (10 9) et téra- (10 12) octets, etc. sont utilisés comme compteurs. Les octets, familiers à tous, mesurent le volume de messages écrits courts, de gros livres, d'œuvres musicales, d'images et produits logiciels... Il est clair que cette mesure ne peut en aucune manière caractériser ce que véhiculent et pourquoi ces unités d'information. Mesure en kilo-octets le roman de L.N. La "guerre et la paix" de Tolstoï est utile, par exemple, pour comprendre s'il peut tenir sur l'espace libre d'un disque dur. C'est aussi utile que de mesurer la taille d'un livre - sa hauteur, son épaisseur et sa largeur - pour évaluer s'il tiendra sur une étagère ou le peser pour voir si le portefeuille supportera le poids combiné.

Alors. une mesure syntaxique de l'information n'est clairement pas suffisante pour caractériser le message : dans notre exemple avec la météo, dans ce dernier cas, le message de l'ami contenait une quantité de données non nulle, mais il ne contenait pas les informations dont nous avions besoin. La conclusion sur l'utilité de l'information découle de l'examen du contenu du message. Mesurer le contenu sémantique de l'information, c'est-à-dire sa quantité au niveau sémantique, nous introduirons la notion de « thésaurus du destinataire de l'information ».

Un thésaurus est une collection d'informations et de connexions entre elles, dont dispose le destinataire de l'information. On peut dire que le thésaurus est la connaissance accumulée du destinataire.

Dans un cas très simple, lorsque le destinataire est appareil technique- un ordinateur personnel, le thésaurus est formé par "l'arme" de l'ordinateur - des programmes et dispositifs embarqués qui vous permettent de recevoir, traiter et présenter des messages texte dans différentes langues en utilisant différents alphabets, polices, ainsi que des informations audio et vidéo provenant d'un réseau local ou mondial. Si votre ordinateur n'est pas équipé d'une carte d'interface réseau, vous ne pouvez pas vous attendre à recevoir des messages d'autres utilisateurs du réseau sous quelque forme que ce soit. Le manque de pilotes avec des polices russes ne permettra pas de travailler avec des messages en russe, etc.

Si le destinataire est une personne, son thésaurus est aussi une sorte d'armement intellectuel d'une personne, un arsenal de ses connaissances. Il forme également une sorte de filtre pour les messages entrants. Le message reçu est traité en utilisant les connaissances disponibles afin d'obtenir des informations. Si le thésaurus est très riche, alors l'arsenal de connaissances est profond et diversifié, il vous permettra d'extraire des informations de presque n'importe quel message. Un petit thésaurus avec peu de connaissances peut devenir un obstacle à la compréhension de messages qui nécessitent une meilleure préparation.


Notez cependant que comprendre le message seul ne suffit pas pour influencer la prise de décision - il doit contenir les informations nécessaires à cela, qui ne sont pas dans notre thésaurus et que nous souhaitons y inclure. Dans le cas de la météo, notre thésaurus ne disposait pas des dernières informations "à jour" sur la météo dans la zone universitaire. Si le message que nous recevons modifie notre thésaurus, le choix de la solution peut changer. Un tel changement dans le thésaurus sert de mesure sémantique de la quantité d'informations, une sorte de mesure de l'utilité du message reçu.

Formellement, la quantité d'informations sémantiques Est, inclus dans le thésaurus, est déterminé par la relation du thésaurus du destinataire S je, et le contenu des informations transmises dans le message "in" S. Une représentation graphique de cette dépendance est illustrée à la figure 1.

Considérez les cas où la quantité d'informations sémantiques Estégal ou proche de zéro :

Pour S je= 0 le destinataire ne perçoit pas les informations entrantes ;

À 0< Sje< S 0 получатель воспринимает, но не понимает поступившую в сообщении информацию;

Pour S je- »∞le destinataire a une connaissance complète et les informations entrantes ne peuvent pas reconstituer son thésaurus.

Riz. Dépendance de la quantité d'informations sémantiques sur le thésaurus du destinataire

Avec un thésaurus S je> S 0 quantité d'informations sémantiques Est récupéré du message joint β information Sgrandit rapidement au début avec la croissance du propre thésaurus du destinataire, et alors - à partir d'une certaine valeur S i - tombe ... La diminution de la quantité d'informations utiles au destinataire est due au fait que la base de connaissances du destinataire est devenue assez solide et qu'il devient de plus en plus difficile de le surprendre avec quelque chose de nouveau.

Cela peut être illustré par l'exemple d'étudiants étudiant l'informatique économique et lisant des documents provenant de sites sur la propriété intellectuelle d'entreprise. . Au départ, dans la formation des premières connaissances sur les systèmes d'information, la lecture donne peu - beaucoup termes incompréhensibles, abréviations, même les titres ne sont pas tous clairs. La persévérance à lire des livres, à assister à des conférences et à des séminaires, à communiquer avec des professionnels aide à reconstituer le thésaurus. Au fil du temps, la lecture des documents du site devient agréable et utile, et à la fin de votre carrière professionnelle - après avoir écrit de nombreux articles et livres - obtenir de nouvelles informations utiles sur un site populaire se produira beaucoup moins souvent.

On peut parler de l'optimal pour cette information S le thésaurus du destinataire, auquel il recevra le maximum d'informations Is, ainsi que sur les informations optimales dans le message "c" pour ce thésaurus Sj. Dans notre exemple, lorsque le destinataire est un ordinateur, le thésaurus optimal signifie que son matériel et les logiciels installés perçoivent et interprètent correctement pour l'utilisateur tous les caractères contenus dans le message « B » qui véhiculent le sens de l'information S. Si le message contient des caractères qui ne correspondent pas au contenu du thésaurus, certaines informations seront perdues et la valeur Est diminuera.

En revanche, si l'on sait que le destinataire n'est pas en mesure de recevoir des textes en russe (son ordinateur n'a pas pilotes requis), et les langues étrangères dans lesquelles notre message peut être envoyé, ni lui ni nous n'avons étudié, pour transmettre les informations nécessaires nous pouvons recourir à la translittération - rédaction de textes russes en utilisant des lettres d'un alphabet étranger, bien perçues par l'ordinateur du destinataire . Cela alignera nos informations avec le thésaurus informatique du destinataire. Le message aura l'air moche, mais tous information nécessaire le destinataire pourra lire.

Ainsi, la quantité maximale d'informations sémantiques provient du message β le destinataire acquiert en acceptant son contenu sémantique S c thésaurus Si,Si = Sj opt). Les informations du même message peuvent avoir un contenu significatif pour un utilisateur compétent et n'avoir aucun sens pour un utilisateur incompétent. La quantité d'informations sémantiques dans le message reçu par l'utilisateur est une valeur individuelle et personnalisée - contrairement aux informations syntaxiques. Cependant, les informations sémantiques sont mesurées de la même manière que les informations syntaxiques - en bits et en octets.

Une mesure relative de la quantité d'informations sémantiques est le coefficient de contenu C, qui est défini comme le rapport entre la quantité d'informations sémantiques et son volume de données. Vd, contenu dans le message β:

C = Is / Vd

Cours 2 sur la discipline "Informatique et TIC"

Vous avez aimé l'article ? A partager entre amis :