какова емкость знака генетического кода информационная
Какова информационная емкость знака генетического кода?
ДНК-спираль представляет из себя как бы веревочную лестницу. Перекладины этой лестницы отстоят друг от друга на рас-стоянии порядка 4 ангстрем, что соответствует 4·10-8 см. Длина всей «лестницы» около 200 см. Количество всех «перекладин» есть частное от деление длины на расстояние между перекладинами, т. е. N = 200/4·10-8 = 5·109. Как известно из биологии, каждая «перекладина» может быть в 4 вариантах. Не будем тратить время на выписывание мудрёных названий. Отсюда в ДНК код не двоичный, как это принято в компьютерах, а четырехбуквенный. Больше ничего из биологии мы знать не хотим, потому что именно эта лестница и есть генный инфоматорий согласно школьным учебникам. Остаётся оценить его информационную вместимость.
Всего за счет вариаций букв в двух последних ячейках возникает k в квадрате вариантов текста. Рассмотрение третьей от конца ячейки совместно с двумя последними даст k в кубе вариантов текста. Эти рассуждения выявляют закономерность. Видно, что показатель степени, в которую надо возвести число k, равен числу ячеек, в которые вставляются буквы. Когда мы дойдем до первой ячейки, то число возможных вариантов текста составит M = k в степени N. Мы можем подставить в эту формулу наши конкретные цифры и получить очень большое число. Оно гипнотизирует своими нулями.
Мы его сильно поуменьшим, если введём общепринятое в информатике определение: «Информация численно равна логарифму при основании 2 от числа возможных текстов». Это означает в общем случае (предполагается знание школьной алгебры) I = log2k в степени N = N умноженное на log2k. Мы обращаем внимание, что информация, заключённая в данной буквенной последовательности сильно (пропорционально) зависит от общего числа ячеек, куда надо вставлять буквы, и слабо (логарифмически) от количества применяемых букв. Скажем, если число букв увеличилось до 16 то по сравнению с двоичным кодом, объём информации вырос всего лишь в 4 раза.
Урок 6
Алфавитный подход к измерению количества информации
§ 1.3. Количество информации
Содержание урока
1.3.3. Алфавитный подход к определению количества информации
1.3.3. Алфавитный подход к определению количества информации
При алфавитном подходе к определению количества информации отвлекаются от содержания (смысла) информации и рассматривают информационное сообщение как последовательность знаков определенной знаковой системы.
Рис. 1.13. Передача информации
Формула (1.1) связывает между собой количество возможных информационных сообщений N и количество информации I, которое несет полученное сообщение. В рассматриваемой ситуации N — это количество знаков в алфавите знаковой системы, а / — количество информации, которое несет каждый знак:
С помощью этой формулы можно, например, определить количество информации, которое несет один знак в двоичной знаковой системе:
Таким образом, в двоичной знаковой системе знак несет 1 бит информации. Интересно, что сама единица измерения количества информации «бит» (bit) получила свое название от английского словосочетания «Binary digiT» — «двоичная цифра».
Информационная емкость знака двоичной знаковой системы составляет 1 бит.
Чем большее количество знаков содержит алфавит знаковой системы, тем большее количество информации несет один знак. В качестве примера определим количество информации, которое несет буква русского алфавита. В русский алфавит входят 33 буквы, однако на практике часто для передачи сообщений используются только 32 буквы (исключается буква «ё»).
С помощью формулы (1.1) определим количество информации, которое несет одна буква русского алфавита:
Таким образом, буква русского алфавита несет 5 битов информации.
Количество информации, которое несет знак, зависит от вероятности его получения. Если получатель заранее точно знает, какой знак придет, то полученное количество информации будет равно 0. Наоборот, чем менее вероятно получение знака, тем больше его информационная емкость.
В русской письменной речи частота использования букв в тексте различна. Так, в среднем на 1000 знаков осмысленного текста приходится 200 букв «а» и в 100 раз меньшее количество буквы «ф» (всего 2). Таким образом, с точки зрения теории информации, информационная емкость знаков русского алфавита различна (у буквы «а» она наименьшая, а у буквы «ф» — наибольшая).
Количество информации в сообщении. Сообщение состоит из последовательности знаков, каждый из которых несет определенное количество информации.
Если знаки несут одинаковое количество информации, то количество информации IС в сообщении можно подсчитать, умножив количество информации I, которое несет один знак, на длину кода (количество знаков в сообщении) К:
Так, каждая цифра двоичного компьютерного кода несет 1 бит информации. Следовательно, две цифры несут 2 бита информации, три цифры — 3 бита и т. д. Количество информации в битах равно количеству цифр двоичного компьютерного кода (табл. 1.3).
Таблица 1.3. Количество информации,
которое несет двоичный компьютерный код
Задания для самостоятельного выполнения
1.8. Задание с выборочным ответом. Какое количество информации содержит один разряд двоичного числа?
1) 1 байт
2) 3 бита
3) 4 бита
4) 1 бит
1.9. Задание с кратким ответом. Какое количество информации несет двоичный код 10101010?
1.10. Задание с кратким ответом. Какова информационная емкость знака генетического кода?
Cкачать материалы урока
Какова информационная емкость знака генетического кода?
Какова информационная емкость знака генетического кода.
Какое количество информации несет двоичный код 10101010?
При этом информационное сообщение уменьшилось на 480 бит.
Какова длина сообщения в символах?
Измерьте примерную информационную емкость одной страницы учебника, всего учебника?
Измерьте примерную информационную емкость одной страницы учебника, всего учебника.
Сколько таких учебников может поместиться на диске емкостью 600 Мбайт, емкостью 2 Гбайта.
1. Выберите правильный ответ : Какое количество информации содержит один разряд двоичного числа?
1. Выберите правильный ответ : Какое количество информации содержит один разряд двоичного числа?
3. Какова информационная емкость знака генетического кода?
Обладают ли генетическим кодом растения, животные, человек?
Обладают ли генетическим кодом растения, животные, человек?
В школе 800 учащихся, коды учащихся записаны в школьной информационной системе с помощью минимального количества бит?
В школе 800 учащихся, коды учащихся записаны в школьной информационной системе с помощью минимального количества бит.
Каков информационный объём сообщения о кодах 320 учащихся, присутствующих на конференции?
Информационное обеспечение Способы кодирования информации?
Информационное обеспечение Способы кодирования информации.
Требования к кодам.
При этом информационное сообщение уменьшилось на 800 бит.
Какова длина сообщения в символах?
При этом информационное сообщение увеличилось на 480 бит.
Какова длина сообщения в символах?
Информационная емкость некоторого алфавита составляет 5 бит?
Информационная емкость некоторого алфавита составляет 5 бит.
Какова мощность этого алфавита?
8байт = 1 бит 1) 16 бит равно 2 байта 2) 0. 5 бит.
Открытый интегрированный урок «Генетический код. Информационный объем генгетического кода»
Муниципальное образовательное учреждение «Лицей №2» г.Нальчик
Кафедра информатики и ИКТ
ОТКРЫТЫЙ
ИНТЕГРИРОВАННЫЙ УРОК
на тему:
Составила:
Мащенко Марина Владимировна – учитель информатики
ЦЕЛИ:
научить строить модели изучаемых объектов с использованием Microsoft Excel;
освоить способы визуализации числовых данных;
закрепление понятий и навыков работы с электронной таблицей Microsoft Excel;
обобщение и закрепление материала по теме: “ ”
развивать навыки формализации при решении информационных задач с помощью средств электронного процессора;
развивать способность анализировать и обобщать изученный материал.
восприятие компьютера как инструмента обработки информационных объектов;
воспитывать аккуратность, точность, внимательность в работе, чувство профессиональной ответственности.
Межпредметные связи: биология, биохимия, микробиология, информатика.
ХОД УРОКА
I. ОРГАНИЗАЦИЯ КЛАССА
II. ВСТУПИТЕЛЬНОЕ СЛОВО (учитель информатики)
В настоящее время наиболее яркие открытия происходят на стыке наук. Возникают новые науки: биоинженерия, бионика, биоинформатика. Это яркий пример интеграции наук. Сегодня на уроке мы с вами совместим материал информатики и биологии по темам “Измерение информации”, “Модели”, “Построение диаграмм и графиков в ЭТ Excel”, “ДНК и РНК” с использованием компьютерных технологий.
III. АКТУАЛИЗАЦИЯ ЗНАНИЙ
(повторение пройденного материала на уроке биологии, для обобщения и применения полученных ранее знаний при решении задач по определению объема информации с биологической составляющей)
Презентация слайды 1-12
Ответ уч-ся по теме “Моделирование”
Вопросы по теме “Модели”:
Какие свойства реальных объектов воспроизводят следующие
модели:
скелет человека в кабинете биологии.
Что такое информационная модель?
Поясните разницу между технической моделью самолета и информационной моделью самолета — чертежом.
Приведите различные примеры графических информационных моделей.
Какая форма графической модели (карта, схема, чертеж, график) применима для отображения процессов?
IV. Работа в тетради
Примеры решения задач
(1,2 – обязательно, если класс сильный можно разобрать задачи 3-6)
Фрагмент правой цепи ДНК имеет следующий нуклеотидный состав: ГГГЦАТААЦГЦТ.
Определите порядок чередования нуклеотидов в, левой цепи.
Какова длина данного фрагмента молекулы ДНК?
Определите процент содержания каждого нуклеотида в данном фрагменте.
1). По принципу комплементарности строим левую цепь ДНК:
2). Так как молекула ДНК двухцепочная, следовательно, ее длина равна длине одной цепи.
Один нуклеотид занимает в молекуле ДНК 0,34 нм. Отсюда длина данного фрагмента:
0,34 нмх 12 = 4,08 нм
3). Всего в данном фрагменте молекулы ДНК будет
Из них А = 5, или 20,8%
По правилу Чаргаффа А + Г = А+Ц, А = Т, Г=Ц
Ответ: А = 20,8%; Т = 20,8%; Г = 29,2%; Ц = 29,2%.
Если дополнить данную задачу вопросом:
Каков информационный объём приведенного фрагмента цепи ДНК?
То данная задача имеет решение уже с точки зрения определения количества информации несущего данным фрагментом цепи ДНК (вероятностный подход).
P г=Рц=29,2% по данным и решению биологической задачи
Формулы для решения
Решение информационной задачи
P а=Рт=1/ N → Nat =1/0,208
iat = бит содержит сообщение о выпадении А и Т
igc = бит содержит сообщение о выпадении Г и Ц
Химический анализ показал, что 16% общего числа нуклеотидов данной и-РНК приходится на аденин, 29% — на гуанин, 42% — на цитозин.
Определите процентный состав азотистых оснований ДНК, «слепком» с которой является данная и-РНК.
1). Определяем процентное содержание уридиловых нуклеотидов в и-РНК:
100% — (16% + 29% + 42%) = 13%.
2). Определяем процентный состав той из цепочек ДНК, «слепком» с которой является данная и-РНК:
3). Вторая цепочка ДНК будет комплементарна первой:
4). В целом в молекуле ДНК процент нуклеотидов будет равен:
Ответ: А = 14,5%; Т = 14,5%; Г = 35,5%; Ц = 35,5%.
Исследования показали, что в иРНК содержится 84% гуанина, 18% урацила, 28% цитозина, 20% аденина. Определите процентный состав азотистых оснований в участке ДНК, являющегося матрицей для данной иРНК.
Ответы к задачам 5-6
5. ЦАЦ АТТ ГЦТ ГГЦ ТАТ ГАЦ АТГ ТГГ.
6. АТЦ ТГА ЦЦА ТГТ ТЦЦ ЦЦА АГТ.
– Ребята скажите, а всё что нас окружает имеет звуковой эквивалент?
– Можно ли услышать музыку природы?
Прослушаем как звучит фрагмент цепи ДНК. (ProM—Protein Music – Генератор музыки цепи ДНК)
Значит, мы можем услышать самое малое и невидимое нам. Каждый из нас имеет свою уникальную мелодию.
V. Повторение пройденного материала (“Компьютерное моделирование”)
Моделирование – это метод познания, состоящий в создании и исследовании моделей.
Практически во всех науках о природе, живой и неживой, об обществе, построение и использование моделей является мощным орудием познания. Реальные объекты и процессы бывают столь многогранны и сложны, что лучшим способом их изучения часто является построение модели, отображающей лишь какую-то грань реальности и потому многократно более простой, чем эта реальность, и исследование этой модели. Многовековой опыт развития науки доказал на практике плодотворность такого подхода.
В моделировании есть два разных пути. Модель может быть похожей копией объекта, выполненной из другого материала, в другом масштабе, с отсутствием ряда деталей. Например, это игрушечный кораблик, самолетик, домик из кубиков и множество других натурных моделей. Модель может, однако, отображать реальность более абстрактно — словесным описанием в свободной форме, описанием, формализованным по каким-то правилам, математическими соотношениями и т. д.
Цели моделирования:
модель нужна для того, чтобы понять, как устроен конкретный объект (или как проистекает процесс), какова его структура, основные свойства, законы развития и взаимодействия с окружающим миром (понимание);
модель нужна для того, чтобы научиться управлять объектом (или процессом) и определять наилучшие способы управления при заданных целях и критериях (управление);
модель нужна для того, чтобы прогнозировать прямые и косвенные последствия реализации заданных способов и форм воздействия на объект (прогнозирование).
Основные этапы разработки и исследования моделей на компьютере:
1. обычно строится описательная информационная модель. Такая модель выделяет существенные, с точки зрения целей проводимого исследования, параметры объекта, а несущественными параметрами пренебрегает.
2. создается формализованная модель, то есть описательная информационная модель записывается с помощью какого-либо формального языка. В такой модели с помощью формул, уравнений, неравенств и пр. фиксируются формальные соотношения между начальными и конечными значениями свойств объектов, а также накладываются ограничения на допустимые значения этих свойств.
Однако далеко не всегда удается найти формулы, явно выражающие искомые величины через исходные данные. В таких случаях используются приближенные математические методы, позволяющие получать результаты с заданной точностью.
3. необходимо формализованную информационную модель преобразовать в компьютерную модель, то есть, выразить ее на понятном для компьютера языке. Существуют два принципиально различных пути построения компьютерной модели:
построение алгоритма решения задачи и его кодирование на одном из языков программирования;
построение компьютерной модели с использованием
одного из приложений (электронных таблиц, СУБД и пр.).
В процессе создания компьютерной модели полезно разработать удобный графический интерфейс, который позволит визуализировать формальную модель, а также реализовать интерактивный диалог человека с компьютером на этапе исследования модели.
4. состоит в проведении компьютерного эксперимента. Если компьютерная модель существует в виде программы на одном из языков программирования, ее нужно запустить на выполнение и получить результаты.
5. состоит в анализе полученных результатов и корректировке исследуемой модели. В случае различия результатов, полученных при исследовании информационной модели, с измеряемыми параметрами реальных объектов можно сделать вывод, что на предыдущих этапах построения модели были допущены ошибки или неточности. Например, при построении описательной качественной модели.
Прежде чем строить информационную модель, производится системный анализ объекта моделирования.
Задача системного анализа — выделить существенные части, свойства, связи моделируемой системы, определить ее структуру.
V I. Компьютерное моделирование – практикум (учитель информатики)
Наглядным способом представления информационных моделей являются графические изображения: карты, чертежи, схемы, графики.
Электронные таблицы (так же, как и базы данных) можно рассматривать как информационные модели реальных объектов или процессов.
На материале биологии по теме “ДНК и РНК” построим схематическую информационную модель
Учитель: Сегодня мы попробуем сделать наглядные пособия своими руками
1. эскиз – схему модели ДНК
2. эскиз – схему азотных оснований нуклеиновых кислот
Создать на Лист1 таблицу замен в цепи ДНК с использованием логической функции ЕСЛИ.
Создать на Лист2 форму одной из азотистых оснований ( номер основания соответствует номеру варианта ).
Примечание: Используйте алгоритм установки границ ячейки. См. Задание 3
Создать на Лист3 форму бумажной модели цепи ДНК средствами электронной таблицы Microsoft Excel
Установка границ ячейки
Произвести щелчок ПКМ.
Выбрать ФОРМАТ ЯЧЕЕК – вкладка ГРАНИЦА – выберите ТИП ЛИНИИ – в ОТДЕЛЬНЫ Е выбрать вид окошка с нужной границей – ОК.
Повторите действия 1-3 с нужным выбором типа линии и расположением границы ячейки
Установка заливки ячейки
Произвести щелчок ПКМ.
Повторите действия 1-3 с нужным выбором цвета и типа штриховки выбранной ячейки
Алгоритм сбора модели ДНК
Распечатать полученную модель,
прогнуть по жирным линиям от себя (как по первому сгибу),
Модель сама свернется в спираль, останется только немного сжать. В модели как раз немного больше одного витка (11 пар нуклеотидов).
Вопросы по теме “Электронные таблицы”:
Что такое табличный процессор?
Какими функциональными возможностями обладает электронные таблицы?
Что в электронной таблице называют ячейкой?
Как именуются ячейки таблицы?
Какая информация может храниться в ячейках?
Что происходит в электронной таблице в результате замены числа в ячейке на новое значение?
Что необходимо сделать для выделения всей строки?
Что необходимо сделать для выделения всего столбца?
В каких форматах электронные таблицы могут представлять числовые данные?
Что необходимо сделать для объединения нескольких ячеек?
Что необходимо сделать для закрашивания ячейки или нескольких ячеек?
VII. Подведение итогов
Выписать в тетрадь слова изученной темы, трудные для запоминания.
“ Электронные таблицы и математическое моделирование”
Использование электронных таблиц в научных целях (для прогнозирования)
Сообщения уч-ся по данной теме из других источников.
Какова емкость знака генетического кода информационная
Количество информации как мера уменьшения неопределённости знания
За единицу количества информации принято такое количество информации, которое содержит сообщение, уменьшающее неопределенность знания в 2 раза. Такая единица названа бит.
В качестве количества возможных событий могут быть количество клеточек на игровом поле, варианты ответов, количество цветов в палитре, градации громкости и частоты звука, количество граней у пирамидки или многогранника, число букв в алфавите и т.д.
Единицы измерения количества информации:
Основная единица измерения: 1 бит. При вычислении в формулу подставляется количество информации, выраженное в битах!
Производные единицы: 1 байт=2 3 бит=8 бит
1 Кбайт=2 10 ∙байт=1024∙байт=? бит
1 Мбайт=2 10 ∙Кбайт=1024∙Кбайт=? байт=? бит
1 Гбайт=2 10 ∙Мбайт=1024∙Мбайт=? Кбайт=? байт=? бит
Примеры решения задач
1. Насыщенность цвета кодируется 1 байтом. Определить количество градаций насыщенности.
I =1байт=8 бит, N =2 8 =256
Кол-во градаций насыщенности N =?
Ответ: кол-во градаций насыщенности цвета N =256.
2. Какова информационная ёмкость знака генетического кода?
кол-во возможных событий – кол-во знаков алфавита N =4
Информационная ёмкость I =?
Ответ: информационная ёмкость знака генетического кода I =2 бит.
3. Звуковой сигнал был дискретизирован сначала с использованием 256 уровней интенсивности сигнала, а затем с использованием 65536 уровней. Во сколько раз изменился информационный объём сигнала?
Кол-ва уровней сигнала N 1 =256, N 2 =65536
Определим информационные объёмы:
Изменение информационного объёма I 2 / I 1 =?
Ответ: изменение информационного объёма I 2 / I 1 =2.
4. Сколько байт в 1 Мбайте? Решение: 1∙Мбайт=2 10 ∙Кбайт=2 10 ∙2 10 ∙байт= 1024∙1024∙байт=1048576 байт.
5. В коробке 16 кубиков различных цветов. Сколько бит информации несет сообщение о том, что из коробки достали зеленый кубик?