Подсистема "Компьютерная транскриптомика".
Предварительная обработка предкластеризационных файлов
В данной версии система проводит анализ предкластеризационных файлов, т.е. файлов, содержащих данные двумерной числовой таблицы
“профиль экспрессии (ген) х образец” с текстовыми ключами строк и колонок. Предварительная обработка включает в себя
статистическую обработку с предварительной фильтрацией, центрированием и нормированием значений.
Система предлагает средства (загрузчик) для переноса исходного файла пользователя на сервер.
Описание модуля статистической обработки
Модуль производит вычисление статистических параметров:
- среднее значение
- дисперсия
- стандартное отклонение
- коэффициент вариации
Исходные данные и команды для работы модуля содержатся в XML-сценарии scen_predv4.xml.
Специализированными командами для данного модуля являются:
- фильтрация неполных строк с отсутствующими данными;
- логарифмическое преобразование;
- фильтрация неинформативных сигналов: удаление генных строк с незначительными изменениями значений интенсивности сигналов;
- центрирование строк;
- нормировка строк;
- центрирование колонок;
- нормировка колонок.
Значения параметров можно исправить во время работы блока в форме показа сценария:
Порядок работы:
- нажать ссылку "Вычисление статистических параметров"
- просмотреть значения параметров
- при необходимости изменить значения параметров и имена файлов и нажать кнопку "Сохранить"
- отработать сценарий, нажав кнопку "Выполнить"
- просмотреть содержимое выходного файла, нажав ссылку на имени файла
- просмотреть графическую визуализацию выходного файла, нажав ссылку на имени графического файла
В данной версии подсистемы предполагается, что на вход можно подавать только предкластеризационные файлы,
т.е. файлы в которых по строкам размещаются значения интенсивности для данного гена, а по столбцам - для данного образца.
Пользователь может загрузить соответствующий файл со своего компьютера посредством Загрузчик файлов на сервер.
После загрузки файла на сервер система присваивает файлу имя с префиксом равном имени проекта.
Описание сценария.
Пользователь должен поменять параметры, описывающие этот файл. Эти параметры задаются в команде, реализующей функцию "vvod" :
- количество колонок с названиями
- количество колонок с числовыми значениями
Описание загрузчика
Вызывается модуль "Загрузчик файлов на сервер".
С помощью данного модуля пользователь может перенести следующие файлы, подготовленные на локальном компьютере, в новый проект.
- исходный файл с профилями
- файл для группировки
- файл "временная шкала"
Для каждого типа файлов пользователь с помощью кнопки Browse вызывает диалог выбора файла.
Выбранные файл переносится на сервер нажатием кнопки Загрузить.
Модуль выводит имена и размеры созданных в проекте файлов.
Дифференциальная экспрессия генов
Данная компонента производит расчеты по следующим сценариям:
Расчет критерия кратной разницы
Модуль анализирует профили на основе критерия кратной разницы.
Исходные данные и команды для работы модуля содержатся в XML-сценарии scen_dif1.xml.
После загрузки исходного файла нужно поменять значение следующих параметров для сценария:
- 2 - номер последней текстовой
- 31 - количество образцов (числовых колонок со значениями интенсивности) для профиля
- 0.1 - значение порогового параметра
Значения параметров можно исправить в сценарии во время работы модуля в форме показа сценария.
Порядок работы:
- нажать ссылку "Расчет критерия кратной разницы"
- просмотреть значения параметров
- при необходимости изменить значения параметров и нажать кнопку "Сохранить"
- отработать сценарий, нажав кнопку "Выполнить"
- просмотреть содержимое выходных файла, нажав ссылку на имени файла
Расчет t-критерия Уэлша
Модуль анализирует профили на основе критерия кратной разницы.
Исходные данные и команды для работы модуля содержатся в XML-сценарии scen_dif2.xml.
Cценарий настроен на использование следующих параметров по умолчанию:
- 2 - номер последней текстовой колонки
- 31 - количество образцов (числовых колонок со значениями интенсивности) для профиля
- normal - первый групирующий код
- symptomatic - второй групирующий код
Значения параметров можно исправить в сценарии во время работы модуля в форме показа сценария.
Порядок работы:
- нажать ссылку "Расчет критерия кратной разницы"
- просмотреть значения параметров
- при необходимости изменить значения параметров и нажать кнопку "Сохранить"
- отработать сценарий, нажав кнопку "Выполнить"
- просмотреть содержимое выходных файла, нажав ссылку на имени файла
Выявление конститутивных профилей экспрессии генов
Модуль выявляет профили на основе критерия кратной разницы.
Исходные данные и команды для работы модуля содержатся в XML-сценарии scen_dif3.xml.
После загрузки исходного файла нужно поменять значение следующих параметров для сценария:
- 2 - номер последней текстовой колонки
- 31 - количество образцов (числовых колонок со значениями интенсивности) для профиля
- 20 - значение порогового параметра
Значения параметров можно исправить в сценарии во время работы модуля в форме показа сценария.
Порядок работы:
- нажать ссылку "Выявление конститутивных профилей экспрессии генов"
- просмотреть значения параметров
- при необходимости изменить значения параметров и нажать кнопку "Сохранить"
- отработать сценарий, нажав кнопку "Выполнить"
- просмотреть содержимое выходных файла, нажав ссылку на имени файла
Выявление индуцибельных профилей экспрессии генов
Модуль выявляет профили на основе критерия кратной разницы.
Исходные данные и команды для работы модуля содержатся в XML-сценарии scen_dif4.xml.
После загрузки исходного файла нужно поменять значение следующих параметров для сценария:
- 2 - номер последней текстовой колонки
- 8 - количество образцов (числовых колонок со значениями интенсивности) для профиля
Значения параметров можно исправить в сценарии во время работы модуля в форме показа сценария.
Порядок работы:
- нажать ссылку "Выявление индуцибельных профилей экспрессии генов"
- просмотреть значения параметров
- при необходимости изменить значения параметров и нажать кнопку "Сохранить"
- отработать сценарий, нажав кнопку "Выполнить"
- просмотреть содержимое выходных файла, нажав ссылку на имени файла
Выявление циклических профилей экспрессии генов
Модуль выявляет профили на основе критерия кратной разницы.
Исходные данные и команды для работы модуля содержатся в XML-сценарии scen_dif5.xml.
Cценарий настроен на использование следующих параметров по умолчанию:
- 2 - номер последней текстовой колонки
- 8 - количество образцов (числовых колонок со значениями интенсивности) для профиля
Значения параметров можно исправить в сценарии во время работы модуля в форме показа сценария.
Порядок работы:
- нажать ссылку "Выявление циклических профилей экспрессии генов"
- просмотреть значения параметров
- при необходимости изменить значения параметров и нажать кнопку "Сохранить"
- отработать сценарий, нажав кнопку "Выполнить"
- просмотреть содержимое выходных файла, нажав ссылку на имени файла
Анализ профилей экспрессии генов
Данная компонента производит расчеты по следующим сценариям:
Иерархическая кластеризация профилей экспрессии генов
Модуль проводит иерархическую кластеризацию профилей.
Исходные данные и команды для работы модуля содержатся в XML-сценарии scen_prof1.xml.
Нужно иметь в виду, что расчет занимает несколько минут.
Cценарий настроен на использование следующих параметров по умолчанию:
- 2 - номер последней текстовой колонки
- 31 - количество образцов (числовых колонок со значениями интенсивности) для профиля
Значения параметров можно исправить в сценарии во время работы модуля в форме показа сценария.
Порядок работы:
- нажать ссылку "Выявление циклических профилей экспрессии генов"
- просмотреть значения параметров
- при необходимости изменить значения параметров и нажать кнопку "Сохранить"
- отработать сценарий, нажав кнопку "Выполнить"
- просмотреть содержимое выходных файла, нажав ссылку на имени файла
- просмотреть дендограмму иерархической кластеризации, нажав ссылку на имени графического файла
Анализ профилей экспрессии генов методом главных компонент (PCA)
Модуль проводит анализ профилей экспрессии генов методом главных компонент (PCA).
Исходные данные и команды для работы модуля содержатся в XML-сценарии scen_prof2.xml.
После загрузки исходного файла нужно поменять значение следующих параметров для сценария:
- 2 - номер последней текстовой колонки
- 31 - количество образцов (числовых колонок со значениями интенсивности) для профиля
Параметры для отрисовки "Расположение образцов на плоскости собственных векторов"
- 2 - номер колонки для отрисовки
- 3 - колонка для оси X
- 4 - колонка для оси Y
Параметры для отрисовки "Расположение профилей экспрессии генов на плоскости I и III главных компонент"
- 3 - номер колонки для отрисовки
- 4 - колонка для оси X
- 6 - колонка для оси Y
Значения параметров можно исправить в сценарии во время работы модуля в форме показа сценария
Порядок работы:
- нажать ссылку "Выявление циклических профилей экспрессии генов"
- просмотреть значения параметров
- при необходимости изменить значения параметров и нажать кнопку "Сохранить"
- отработать сценарий, нажав кнопку "Выполнить"
- просмотреть содержимое выходных файла, нажав ссылку на имени файла
- просмотреть графическую визуализацию выходного файла, нажав ссылку на имени графического файла
Анализ профилей экспрессии генов с помощью самоорганизующихся карт признаков (SOM)
Модуль проводит анализ профилей экспрессии генов с помощью самоорганизующихся карт признаков (SOM).
Исходные данные и команды для работы модуля содержатся в XML-сценарии scen_prof3.xml.
Параметры по умолчанию для входного файла:
- 2 - номер последней текстовой колонки
- 31 - количество образцов (числовых колонок со значениями интенсивности) для профиля
Параметры для функции SOM
- 10 - размерность шкалы по X
- 3 - размерность шкалы по Y
- 1000000 - количество итераций
- 0.1 - степень аппроксимации
Значения параметров можно исправить в сценарии во время работы модуля в форме показа сценария
Порядок работы:
- нажать ссылку "Выявление циклических профилей экспрессии генов"
- просмотреть значения параметров
- при необходимости изменить значения параметров и нажать кнопку "Сохранить"
- отработать сценарий, нажав кнопку "Выполнить"
- просмотреть содержимое выходных файла, нажав ссылку на имени файла
- просмотреть графическую визуализацию выходного файла, нажав ссылку на имени графического файла
Анализ ген-генных взаимодействий
Данная компонента производит расчеты по следующим сценариям:
Поиск генов-представителей SOM-кластеров
Модуль проводит анализ профилей экспрессии генов с помощью самоорганизующихся карт признаков (SOM).
Исходные данные и команды для работы модуля содержатся в XML-сценарии scen_gengen1.xml.
Параметры по умолчанию для входного файла:
- 2 - номер последней текстовой колонки
- 31 - количество образцов (числовых колонок со значениями интенсивности) для профиля
Параметры для функции SOM
- 10 - размерность шкалы по X
- 3 - размерность шкалы по Y
- 1000000 - количество итераций
- 0.1 - степень аппроксимации
Порядок работы:
- нажать ссылку "Выявление циклических профилей экспрессии генов"
- просмотреть значения параметров и имена файлов
- при необходимости изменить значения параметров и имена файлов и нажать кнопку "Сохранить"
- отработать сценарий, нажав кнопку "Выполнить"
- просмотреть содержимое выходных файла, нажав ссылку на имени файла
- просмотреть графическую визуализацию выходного файла, нажав ссылку на имени графического файла
Поиск генов-представителей SOM-кластеров
Модуль проводит анализ профилей экспрессии генов с помощью самоорганизующихся карт признаков (SOM).
Исходные данные и команды для работы модуля содержатся в XML-сценарии scen_gengen2.xml.
Значения параметров можно исправить в сценарии во время работы модуля в форме показа сценария.
Параметры по умолчанию для входного файла:
- 2 - номер последней текстовой колонки
- 31 - количество образцов (числовых колонок со значениями интенсивности) для профиля
Параметры для функции SOM
- 10 - размерность шкалы по X
- 3 - размерность шкалы по Y
- 1000000 - количество итераций
- 0.1 - степень приближения
Порядок работы:
- нажать ссылку "Выявление циклических профилей экспрессии генов"
- просмотреть значения параметров
- при необходимости изменить значения параметров и нажать кнопку "Сохранить"
- отработать сценарий, нажав кнопку "Выполнить"
- просмотреть содержимое выходных файла, нажав ссылку на имени файла
- просмотреть графическую визуализацию выходного файла, нажав ссылку на имени графического файла
База данных БЗ ПГЭ (профили генной экспрессии)
Модуль позволяет производить поиск по биочип-исследованиям и профилям экспрессии.
Дополнительной возможностью является
функция переноса данных эксперимента из базы во вновь созданный проект.
Порядок работы:
Выбирается вариант поиска.
- Поиск по биочип-исследованиям
- Поиск по профилям экспрессии генов
При выборе "биочип-исследования" задаётся условие поиска на:
- Организм
- Биочип-платформу
- Тип исследования
- Орган, ткань или клетки (название)
- Ключевое слово
Найденные исследования группируются по экспериментам.
Данные эксперимента из базы во вновь созданный проект можно загрузить по ссылке "Переслать данные эксперимента в проект "
При выборе "профили экспрессии генов" задаётся условие поиска на:
Найденные профили показыватся графически с указанием префикса эксперимента.
Просмотреть эксперимент можно через поиск по биочип-исследованиям, указав префикс.