806afc4b325d941f1b27f13fb1b40827be540705
[django_unres.git] / django_simple / todo / templates / outputs.html
1 {% extends "base.html" %}
2
3 {% load i18n lazysignup_tags %}
4 {% block content %}
5
6 <P>
7 <H1 ALIGN=CENTER>DESCRIPTION OF THE OUTPUT FILES FROM THE UNRES SERVER</H1>
8 </P>
9 <HR>
10
11 <P>
12
13 <P>
14 <BR>
15
16 <H2><A NAME="SECTION00010000000000000000">
17 Contents</A>
18 </H2>
19 <!--Table of Contents-->
20
21 <UL>
22 <LI><A NAME="tex2html30"
23   HREF="outputs.html#SECTION00020000000000000000">GENERAL INFORMATION</A>
24 <LI><A NAME="tex2html31"
25   HREF="outputs.html#SECTION00030000000000000000">UNRES OUTPUT FILES</A>
26 <UL>
27 <LI><A NAME="tex2html32"
28   HREF="outputs.html#SECTION00031000000000000000">The main output file(s)</A>
29 <LI><A NAME="tex2html33"
30   HREF="outputs.html#SECTION00032000000000000000">Coordinate files</A>
31 <LI><A NAME="tex2html34"
32   HREF="outputs.html#SECTION00033000000000000000">The summary (STAT) file</A>
33 </UL>
34 <BR>
35 <LI><A NAME="tex2html35"
36   HREF="outputs.html#SECTION00040000000000000000">WHAM OUTPUT FILES</A>
37 <UL>
38 <LI><A NAME="tex2html36"
39   HREF="outputs.html#SECTION00041000000000000000">Summary of the files</A>
40 <LI><A NAME="tex2html37"
41   HREF="outputs.html#SECTION00042000000000000000">The structure of the main output file (out)</A>
42 <LI><A NAME="tex2html38"
43   HREF="outputs.html#SECTION00043000000000000000">The thermodynamic quantity and ensemble average (thermal) files</A>
44 <LI><A NAME="tex2html39"
45   HREF="outputs.html#SECTION00044000000000000000">The conformation summary with classification (stat) files</A>
46 <LI><A NAME="tex2html40"
47   HREF="outputs.html#SECTION00045000000000000000">The histogram files</A>
48 <LI><A NAME="tex2html41"
49   HREF="outputs.html#SECTION00046000000000000000">The rmsd-radius of gyration potential of mean force files</A>
50 <LI><A NAME="tex2html42"
51   HREF="outputs.html#SECTION00047000000000000000">The PDB files</A>
52 <LI><A NAME="tex2html43"
53   HREF="outputs.html#SECTION00048000000000000000">The compressed Cartesian coordinates (cx) files</A>
54 </UL>
55 <BR>
56 <LI><A NAME="tex2html44"
57   HREF="outputs.html#SECTION00050000000000000000">CLUSTER OUTPUT FILES</A>
58 <UL>
59 <LI><A NAME="tex2html45"
60   HREF="outputs.html#SECTION00051000000000000000">Summary of files</A>
61 <LI><A NAME="tex2html46"
62   HREF="outputs.html#SECTION00052000000000000000">Output coordinate files</A>
63 </UL></UL>
64 <!--End of Table of Contents-->
65 <P>
66
67 <H1><A NAME="SECTION00020000000000000000"></A>
68 <A NAME="sect:general"></A>
69 <BR>
70 GENERAL INFORMATION
71 </H1>
72
73 <P>
74 The output files produced by the UNRES server are those from UNRES and, if MREMD calculations
75 were requested, also from WHAM and CLUSTER and the final all-atom model files. The file names
76 begin with file_ for UNRES, WHAM, and cluster, while the files with the final all-atom models are 
77 model01.pdb - model05.pdb. It should be noted that only the files correspoding to the 
78 calculation types available when using the UNRES server are described in this document and 
79 that, for non-server UNRES jobs,
80 other filename prefixes than file_ can be set; for details please see the 
81 <a href="http://www.unres.pl/docs">UNRES web page</a>.
82
83 <P>
84
85 <H1><A NAME="SECTION00030000000000000000"></A>
86 <A NAME="sect:output"></A>
87 <BR>
88 UNRES OUTPUT FILES
89 </H1>
90
91 <P>
92
93 <H2><A NAME="SECTION00031000000000000000"></A>
94 <A NAME="sect:output:main"></A>
95 <BR>
96 The main output file(s)
97 </H2>
98
99 <P>
100 UNRES ``main'' output files (file.out_${POT}[processor], where, by defalut, ${POT}&nbsp;=&nbsp;GB,
101 the Gay-Berne-type sidechain-sidechain interaction potential) 
102 are log files from
103 a run. They contain the information of the molecule, force field, calculation
104 type, control parameters, etc.; however, not the structures produced during
105 the run or their energies except single-point energy evaluation and 
106 minimization-related runs. 
107
108 <P>
109
110 <H2><A NAME="SECTION00032000000000000000"></A>
111 <A NAME="sect:output:coord"></A>
112 <BR>
113 Coordinate files
114 </H2>
115
116 <P>
117 The structural information is included in 
118 coordinate files (*.int, *.x, *.pdb, *.mol2, *.cx) and statistics files (*.stat), 
119 respectively; these files are further processed by WHAM and
120 CLUSTER or can be viewed by molecular viewers (pdb or mol2 files).
121
122 <P>
123
124 <H3><A NAME="SECTION00032100000000000000"></A>
125 <A NAME="sect:output:coord:int"></A>
126 <BR>
127 The internal coordinate (INT) file
128 </H3>
129
130 <P>
131 This file contains the internal coordinates of the conformations produced 
132 by UNRES in non-MD runs. The virtual-bond lengths are assumed constant so
133 only the angular variables are provided.
134
135 <P>
136 IT,ENER,NSS,(IHPB(I),JHPB(I),I=1,NSS)
137 <BR>(I5,F12.5,I2,9(1X,2I3))
138
139 <P>
140 <DL>
141 <DT></DT>
142 <DD>IT - the number of the conformation.
143 </DD>
144 <DT></DT>
145 <DD>ENER - total energy.
146 </DD>
147 <DT></DT>
148 <DD>NSS - the number of disulfide bridges.
149 </DD>
150 <DT></DT>
151 <DD>(IHPB(I),JHPB(I),I=1,NSS) - the positions of the pairs of half-cystines .
152 forming the bridges. If NSS &gt; 9, the remaining pairs are written in the 
153 following lines in the (3X,11(1X,2I3)) format.
154 </DD>
155 </DL>
156
157 <P>
158 (THETA(I),I=3,NRES)
159 <BR>(8F10.4)
160
161 <P>
162 The virtual-bond angles THETA (in degrees)
163
164 <P>
165 (PHI(I),I=4,NRES)
166 <BR>(8F10.4)
167
168 <P>
169 The virtual-bond dihedral angles GAMMA (in degrees)
170
171 <P>
172 (ALPH(I),I=2,NRES-1)
173 <BR>(OMEG(I),I=2,NRES-1)
174 <BR>(8F10.4)
175
176 <P>
177 The polar angles ALPHA and BETA of the side-chain centers (in degrees).
178
179 <P>
180
181 <H3><A NAME="SECTION00032200000000000000"></A> 
182 <A NAME="sect:output:coord:cart"></A>
183 <BR>
184 The plain Cartesian coordinate (X) files
185 </H3>
186
187 <P>
188 (Subroutine CARTOUT.)
189
190 <P>
191 This file contains the Cartesian coordinates of the 
192 &alpha;-carbon and
193 side-chain-center coordinates. All conformations from an MD/MREMD
194 trajectory are collated to a single file. The structure of each
195 conformation's record is as follows:
196
197 <P>
198 1st line: time, potE, uconst, t_bath,nss, (ihpb(j), jhpb(j), j=1,nss),
199 nrestr, (qfrag(i), i=1,nfrag), (qpair(i), i=1,npair),
200 (utheta(i), ugamma(i), uscdiff(i), i=1,nfrag_back)
201
202 <P>
203 <DL>
204 <DT></DT>
205 <DD>time: MD time (in ``molecular time units'' 1 mtu = 48.9 fs),
206 </DD>
207 <DT></DT>
208 <DD>potE: potential energy,
209 </DD>
210 <DT></DT>
211 <DD>uconst: restraint energy corresponding to restraints on Q and backbone geometry,
212 </DD>
213 <DT></DT>
214 <DD>t_bath: thermostat temperature,
215 </DD>
216 <DT></DT>
217 <DD>nss: number of disulfide bonds,
218 </DD>
219 <DT></DT>
220 <DD>ihpb(j), jhpb(j): the numbers of linked cystines for jth disulfide bond,
221 </DD>
222 <DT></DT>
223 <DD>nrestr: number of restraints on q and local geometry,
224 </DD>
225 <DT></DT>
226 <DD>qfrag(i): q value for ith fragment,
227 </DD>
228 <DT></DT>
229 <DD>qpair(i): q value for ith pair,
230 </DD>
231 <DT></DT>
232 <DD>utheta(i): sum of squares of the differences between the theta angles 
233    of the current conformation from those of the experimental conformation,
234 </DD>
235 <DT></DT>
236 <DD>ugamma(i): sum of squares of the differences beaten the gamma angles 
237    of the current conformation from those of the experimental conformation,
238 </DD>
239 <DT></DT>
240 <DD>uscdiff(i): sum of squares of the differences between the Cartesian difference
241    of the unit vector of the C&alpha;
242 -SC axis of the current conformation from 
243    those of the experimental conformation.
244 </DD>
245 </DL>
246
247 <P>
248 Next lines: Cartesian coordinates of the C&alpha;
249  atoms (including dummy atoms)
250 (sequentially, 10 coordinates per line)
251 Next lines: Cartesian coordinates of the SC atoms (including glycines and
252 dummy atoms) (sequentially, 10 coordinates per line)
253
254 <P>
255
256 <H3><A NAME="SECTION00032300000000000000"></A>
257 <A NAME="sect:output:coord:cx"></A>
258 <BR>
259 The compressed Cartesian coordinate (CX) files
260 </H3>
261
262 <P>
263 These files are compressed binary files (extension cx). For each conformation, 
264 the items are written in the same order as specified in section <A HREF="#sect:output:coord:cx">2.2.3</A>. For 
265 MREMD runs, if TRAJ1FILE is specified on MREMD record,
266 snapshots from all trajectories are written every time the coordinates
267 are dumped. Thus, the file contains snapshot 1 from trajectory 1, ...,
268 snapshot 1 from trajectory M, snapshot 2 from trajectory 1, ..., etc.
269
270 <P>
271 The compressed cx files can be converted to pdb file by using the xdrf2pdb
272 auxiliary program (single trajectory files) or xdrf2pdb-m program (multiple
273 trajectory files from MREMD runs generated by using the TRAJ1FILE option).
274 The multiple-trajectory cx files are also input files for the auxiliary
275 WHAM program.
276
277 <P>
278
279 <H3><A NAME="SECTION00032400000000000000"></A>
280 <A NAME="sect:output:coord:PDB"></A>
281 <BR>
282 The Brookhaven Protein Data Bank format (PDB) files
283 </H3>
284
285 <P>
286 (Subroutine PDBOUT.)
287
288 <P>
289 These files are written in PDB standard (see. e.g., 
290 ftp://ftp.wwpdb.org/pub/pdb/doc/format_descriptions/Format_v33_Letter.pdf<FONT COLOR="#0000ff">ftp://ftp.wwpdb.org/pub/pdb/doc/format_descriptions</FONT>). The REMARK, ATOM, SSBOND, HELIX, SHEET, CONECT, TER, and ENDMDL are used.
291 The C&alpha;
292  (marked CA) and SC (marked CB) coordinates are output. The CONECT
293 records specify the C&alpha; - C&alpha; and C&alpha; - SC virtual bonds. Secondary
294 structure is detected based on peptide-group contacts, as specified in 
295 ref 12. Dummy residues are omitted from the output. If the program has
296 multiple-chain function, the presence of a dummy residue in a sequence 
297 starts a new chain, which is assigned the next alphabet letter as ID, and
298 residue numbering is started over.
299
300 <P>
301
302 <H3><A NAME="SECTION00032500000000000000"></A>
303 <A NAME="sect:output:coord:subyll"></A>
304 <BR>
305 The SYBYLL (MOL2) files
306 </H3>
307
308 <P>
309 See the description of mol2 format (e.g., 
310 http://tripos.com/data/support/mol2.pdfhttp://tripos.com/data/support/mol2.pdf. 
311 Similar remarks apply as for
312 the PDB format (section <A HREF="#sect:output:coord:PDB">2.2.4</A>). 
313
314 <P>
315
316 <H2><A NAME="SECTION00033000000000000000">
317 The summary (STAT) file</A>
318 </H2>
319
320 <P>
321 Each line of the stat file generated by MD/MREMD runs contains the following
322 items in sequence:
323
324 <P>
325 <DL>
326 <DT></DT>
327 <DD>step   - the number of the MD step 
328 </DD>
329 <DT></DT>
330 <DD>time   - time [unit is MTU (molecular time unit) equal to 48.9 fs]        
331 </DD>
332 <DT></DT>
333 <DD>Ekin   - kinetic energy [kcal/mol]        
334 </DD>
335 <DT></DT>
336 <DD>Epot   - potential energy [kcal/mol]
337 </DD>
338 <DT></DT>
339 <DD>Etot   - total energy (Ekin+Epot)
340 </DD>
341 <DT></DT>
342 <DD>H-H0   - the difference between the cureent and initial extended Hamiltionian
343          in Nose-Hoover or Nose-Poincare runs; not present for other thermostats.
344 </DD>
345 <DT></DT>
346 <DD>RMSD   - root mean square deviation from the reference structure (only in 
347          REFSTR has been specified)
348 itemdamax  - maximum change of acceleration between two MD steps
349 </DD>
350 <DT></DT>
351 <DD>fracn  - fraction of native side-chain concacts (very crude, based on 
352          SC-SC distance only)
353 </DD>
354 <DT></DT>
355 <DD>fracnn - fraction of non-native side-chain contacts
356 </DD>
357 <DT></DT>
358 <DD>co     - contact order
359 </DD>
360 <DT></DT>
361 <DD>temp   - actual temperature [K]    
362 </DD>
363 <DT></DT>
364 <DD>T0     - initial (microcanonical runs) or thermostat (other run types) 
365          temperature [K] 
366 </DD>
367 <DT></DT>
368 <DD>Rgyr   - radius of gyration based on C&alpha; coordinates [A]   
369 </DD>
370 <DT></DT>
371 <DD>proc   - in MREMD runs the number of the processor (the number of the 
372          trajectory less 1); not present for other runs. 
373 </DD>
374 </DL>
375
376 <P>
377 For an USAMPL run, the following items follow the above list:
378
379 <P>
380 <DL>
381 <DT></DT>
382 <DD>iset   - the number of the restraint set
383 </DD>
384 <DT></DT>
385 <DD>uconst - restraint energy pertaining to q-values 
386 </DD>
387 <DT></DT>
388 <DD>uconst_back - restraint energy pertaining to virtual-backbone restraints
389 </DD>
390 <DT></DT>
391 <DD>(qfrag(i),i=1,nfrag) - q values of the specified fragments
392 </DD>
393 <DT></DT>
394 <DD>(qpair(ii2),ii2=1,npair) - q values of the specified pairs of fragments
395 </DD>
396 <DT></DT>
397 <DD>(utheta(i),ugamma(i),uscdiff(i),i=1,nfrag_back) - virtual-backbone and
398       side-chain-rotamer restraint energies of the fragments specified
399 </DD>
400 </DL>
401
402 <P>
403 If PRINT_COMPON has been specified, the energy components are printed
404 after the items described above.
405
406 <P>
407
408 <H1><A NAME="SECTION00040000000000000000"></A>
409 <A NAME="sect:whamoutfiles"></A>
410 <BR>
411 WHAM OUTPUT FILES
412 </H1>
413
414 <P>
415
416 <H2><A NAME="SECTION00041000000000000000"></A>
417 <A NAME="sect:whamoutfiles:summary"></A>
418 <BR>
419 Summary of the files
420 </H2>
421
422 <P>
423 <DL>
424 <DT></DT>
425 <DD>file.out_POTxxx - output files from different processors (file.out_000 is the main output file). POT is the identifier of the sidechain-sidechain potential.
426
427 <P>
428 </DD>
429 <DT></DT>
430 <DD>file_POT_GB_xxx.stat or file_POT_slice_YYXXX.stat - the summary conformation-classification file from processor xxx (each processor handles part of conformations); the second occurs if the run is partitioned into slices.
431
432 <P>
433 </DD>
434 <DT></DT>
435 <DD>file.thermal or file_slice_yy.thermal - thermodynamic functions and temperature profiles of the ensemble averages (the second form if the run is partitioned into slices).
436
437 <P>
438 </DD>
439 <DT></DT>
440 <DD>file_T_xxx.pdb or file_slice_yy_T_xxx.pdb - top conformations the number of these conformations is selected by the user) in PDB format.
441
442 <P>
443 </DD>
444 <DT></DT>
445 <DD>file.cx - the compressed UNRES coordinate file with information to compute the probability of a given conformation at any temperature.
446
447 <P>
448 </DD>
449 <DT></DT>
450 <DD>file.hist, file_slice_xx.hist, file_par_yy.hist, file_par_yy_slice_zz.x - histograms of q at MREMD temperatures.
451
452 <P>
453 </DD>
454 <DT></DT>
455 <DD>file.ent, file_slice_xx.ent, file_par_yy.ent, file_par_yy_slice_xx.ent - the histogram(s) of energy density.
456
457 <P>
458 </DD>
459 <DT></DT>
460 <DD>file.rmsrgy, file_par_yy.rmsrgy, file_slice_xx.rmsrgy or file_par_yy_slice_xx.rmsrgy - the 2D histogram(s) of rmsd from the experimental structure and radius of gyration.
461
462 <P>
463 </DD>
464 </DL>
465
466 <P>
467
468 <H3><A NAME="SECTION00041100000000000000"></A>
469 <A NAME="sect:whamoutfile:main:reference"></A>
470 <BR>
471 Information of reference structure and comparing scheme
472 </H3>
473
474 <P>
475 The following records pertain to setting up the classification of conformation aimed ultimately at obtaining a class numbers. Fragments and pairs of fragments are specified and compared against those of reference structure in terms of secondary structure, number of contacts, rmsd, virtual-bond-valence and dihedral angles, etc. Then the class number is constructed as described in ref 3. A brief description of comparison procedure is as follows:
476
477 <P>
478
479 <OL>
480 <LI>Elementary fragments usually corresponding to elements of secondary or supersecondary structure are selected. Based on division into fragments, levels of structural hierarchy are defined.
481
482 <P>
483 </LI>
484 <LI>At level 1, each fragment is checked for agreement with the corresponding fragment in the native structure. Comparison is carried out at two levels: the secondary structure agreement and the contact-pattern agreement level.
485
486 <P>
487 At the secondary structure level the secondary structure (helix, strand or undefined) in the fragment is compared with that in the native fragment in a residue-wise manner. Score 0 is assigned if the structure is different in more than 1/3 of the fragment, 1 is assigned otherwise.
488
489 <P>
490 The contact-pattern agreement level compares the contacts between the peptide groups of the backbone of the fragment and the native fragment and also compares their virtual-bond dihedral angles gamma. It is allowed to shift the sequence by up to 3 residues to obtain contact pattern match. A score of 0 is assigned if more than 1/3 of native contacts do not occur or there is more than 60 deg (usually, but this cutoff can be changed) maximum difference in gamma. Otherwise score 1 is assigned.
491
492 <P>
493 The total score of a fragment is an octal number consisting of bits hereafter referred to S (secondary structure) C (contact match) and H (sHift) (they are in the order HCS). Their values are as follows:
494
495 <P>
496 <DL>
497 <DT></DT>
498 <DD>S - 1 native secondary structure; 0 otherwise,
499 </DD>
500 <DT></DT>
501 <DD>C - 1 native contact pattern; 0 otherwise,
502 </DD>
503 <DT></DT>
504 <DD>H - 1 contact match obtained without sequence shift 0 otherwise.
505 </DD>
506 </DL>
507
508 <P>
509 For example,
510 octal 7 (111) corresponds to native secondary structure, native contact pattern, and no need to shift the sequence for contact match;
511 octal 1 (001) corresponds to native secondary structure only (i.e., nonnative contact pattern).
512
513 <P>
514 </LI>
515 <LI>At level 2, contacts between (i) the peptide groups or (ii) the side chains within pairs of fragments are compared. Case (i) holds when we seek contacts between the strands of a larger beta-sheet formed by two fragments, case (ii) when we seek the interhelix or helix-beta sheet contacts. Additionally, the pairs of fragments are compared with their native counterparts by rmsd.
516
517 <P>
518 Score 0 is assigned to a pair of fragments, if it has less than 2/3 native contacts and too large rmsd (a cut-off of 0.1 A/residue is set), score 1 if it has enough native contacts and sufficiently low rmsd, but the sequence has to be shifted to obtain a match, and score 2, if sufficient match is obtained without shift.
519
520 <P>
521 </LI>
522 <LI>At level 3 and higher, triads, quadruplets,..., etc. of fragments are compared in terms of rmsd from their native counterparts (the last level corresponds to comparing whole molecules). The score (0, 1, or 2) is assigned to each composite fragment as in the case of level 2.
523
524 <P>
525 </LI>
526 <LI>The TOTAL class number of a structure is a binary number composed of parts of scores of fragments, fragment pairs, etc. It is illustrated on the following example; it is assumed that the molecule has three fragment as in the case of 1igd.
527
528 <P>
529 </LI>
530 </OL>
531
532 <P>
533 <PRE>
534 level 1      level 2                   level 3
535 123 123 123||1-2 1-3 2-3 1-2 1-3 2-3 || 1-2-3 | 1-2-3 ||
536 sss|ccc|hhh|| c   c   c | h   h   h  ||   r   |   h   ||
537 </PRE>
538
539 <P>
540 Bits s, c, and h of level 1 are explained in point 2; bits c and h of level 2 pertain to contact-pattern match and shift; bits r and h of level 3 pertain to rmsd match and shift for level 3.
541
542 <P>
543
544 <H2><A NAME="SECTION00042000000000000000"></A>
545 <A NAME="sect:whamoutfiles:output:main"></A>
546 <BR>
547 The structure of the main output file (out)
548 </H2>
549
550 <P>
551 The initial portion of the main output file, named file.out_POT_000 contains information of parameter files specified in the C-shell script, compilation info, and the UNRES numeric code of the amino-acid sequence.
552 Subsequently, actual energy-term weights and parameter files are printed. If lprint was set at .true. in parmread.F, all energy-function parameters are printed. If REFSTR was specified in the control-data list, the program then outputs the read reference-structure coordinates and partition of structure into fragments.
553 Subsequently, the information about the number of structures read in and those that were rejected is printed followed by succinct information form the iteration process. Finally, the histograms (also output separately to specific histogram files; see section 6.6) and the data of the dependence of free energy, energy, heat capacity, and conformational averages on temperature are printed (these are also output separately to file described in section <A HREF="#sect:whamoutfiles:histograms">3.5</A>).
554
555 <P>
556 The output files corresponding to non-master processors (file.out_POT_xxx where xxx
557  &gt; 0 contain only the information up to the iteration protocol. These files can be deleted right after the run.
558
559 <P>
560
561 <H2><A NAME="SECTION00043000000000000000"></A>
562 <A NAME="sect:whamoutfiles:outpput:thermo"></A>
563 <BR>
564 The thermodynamic quantity and ensemble average (thermal) files
565 </H2>
566
567 <P>
568 The files file.thermal or file_slice_yy.thermal contain thermodynamic, ensemble-averaged conformation-dependent quantities and their temperature derivatives. The structure of a record is as follows:
569
570 <P>
571 <TABLE CELLPADDING=3>
572 <TR><TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>T</TD>
573 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>F</TD>
574 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>E</TD>
575 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>
576  q_1...q_n
577 </TD>
578 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>rmsd</TD>
579 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>Rgy</TD>
580 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>Cv</TD>
581 </TR>
582 <TR><TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>298.0</TD>
583 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>-83.91454</TD>
584 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>-305.28112</TD>
585 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>0.30647</TD>
586 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>6.28347</TD>
587 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>11.61204</TD>
588 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>0.70886E+01</TD>
589 </TR>
590 </TABLE>
591
592 <P>
593 <TABLE CELLPADDING=3>
594 <TR><TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>
595 var(q<sub>1</sub>) ...
596 </TD>
597 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>var(rmsd)</TD>
598 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>var(Rgy)</TD>
599 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>
600 cov(q<sub>1</sub>,E) ...
601 </TD>
602 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>cov(rmsd,E)</TD>
603 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>cov(Rgy,E)</TD>
604 </TR>
605 <TR><TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>
606 var(q<sub>n</sub>)
607 </TD>
608 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>&nbsp;</TD>
609 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>&nbsp;</TD>
610 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>
611 cov(q<sub>n</sub>,E)
612 </TD>
613 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>&nbsp;</TD>
614 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>&nbsp;</TD>
615 </TR>
616 <TR><TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>0.35393E-02</TD>
617 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>0.51539E+01</TD>
618 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>0.57012E+00</TD>
619 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>0.43802E+00</TD>
620 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>0.62384E+01</TD>
621 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>0.33912E+01</TD>
622 </TR>
623 </TABLE>
624
625 <P>
626 where:
627
628 <P>
629 <DL>
630 <DT></DT>
631 <DD>T - absolute temperature (in K),
632
633 <P>
634 </DD>
635 <DT></DT>
636 <DD>F - free energy at T,
637
638 <P>
639 </DD>
640 <DT></DT>
641 <DD>E - average energy at T,
642
643 <P>
644 </DD>
645 <DT></DT>
646 <DD>
647  q<sub>1</sub>..q<sub>n</sub>
648 : ensemble-averaged q values at T (usually only the total q corresponding to whole molecule is requested, as in the example above, but the user can specify more than one fragment or pair of fragments for which the q's are calculated, If there is no reference structure, this entry contains a 0,
649
650 <P>
651 </DD>
652 <DT></DT>
653 <DD>rmsd - ensemble-averaged root mean square deviation at T,
654
655 <P>
656 </DD>
657 <DT></DT>
658 <DD>Rgy - ensemble-averaged radius of gyration computed from Calpha coordinates at T,
659
660 <P>
661 </DD>
662 <DT></DT>
663 <DD>
664  C<sub>v</sub>
665  - heat capacity at T,
666
667 <P>
668 </DD>
669 <DT></DT>
670 <DD>
671  var(q<sub>1</sub>)...var(q<sub>n</sub>)
672  - variances of q's at T,
673
674 <P>
675 </DD>
676 <DT></DT>
677 <DD>var(rmsd) - variance of rmsd at T,
678
679 <P>
680 </DD>
681 <DT></DT>
682 <DD>var(Rgy) - variance of radius of gyration at T,
683
684 <P>
685 </DD>
686 <DT></DT>
687 <DD>
688  cov(q<sub>1</sub>,E)...cov(q<sub>n</sub>,E)
689  - covariances of q's and energy at T,
690
691 <P>
692 </DD>
693 <DT></DT>
694 <DD>cov(rmsd,E) - covariance of rmsd and energy at T,
695
696 <P>
697 </DD>
698 <DT></DT>
699 <DD>cov(Rgy,E) - covariance of radius of gyration and energy at T.
700
701 <P>
702 </DD>
703 </DL>
704
705 <P>
706 According to Camacho and Thirumalali (Europhys. Lett., 35, 627, 1996), the maximum of the variance of the radius of gyration corresponds to the collapse point of a polypeptide chain and the maximum variance of q or rmsd corresponds to the midpoint of the transition to the native structure. More precisely, these points are inflection points in the plots of the respective quantities which, with temperature-independent force field, are proportional to their covariances with energy.
707
708 <P>
709
710 <H2><A NAME="SECTION00044000000000000000"></A>
711 <A NAME="sect:whamoutfiles:class"></A>
712 <BR>
713 The conformation summary with classification (stat) files
714 </H2>
715
716 <P>
717 The stat files (with names file_POT_xxx.stat or file_POT_sliceyyxxx.stat; where yy is the number of a slice and xxx is the rank of a processor) contain the output of the classification of subsequent conformations (equally partitioned between processors). The files can be concatenated by processor rank to get a summary file. Each line has the following structure (example values are also provided):
718
719 <P>
720 <TABLE CELLPADDING=3 BORDER="1">
721 <TR><TD ALIGN="CENTER">&nbsp;</TD>
722 <TD ALIGN="CENTER">&nbsp;</TD>
723 <TD ALIGN="CENTER" COLSPAN=3>whole molecule</TD>
724 </TR>
725 <TR><TD ALIGN="CENTER">No</TD>
726 <TD ALIGN="CENTER">energy</TD>
727 <TD ALIGN="CENTER">rmsd</TD>
728 <TD ALIGN="CENTER">q</TD>
729 <TD ALIGN="CENTER">ang</TD>
730 </TR>
731 <TR><TD ALIGN="CENTER">9999</TD>
732 <TD ALIGN="CENTER">-122.42</TD>
733 <TD ALIGN="CENTER">4.285</TD>
734 <TD ALIGN="CENTER">0.3751</TD>
735 <TD ALIGN="CENTER">47.8</TD>
736 </TR>
737 </TABLE>
738
739 <P>
740 <TABLE CELLPADDING=3 BORDER="1">
741 <TR><TD ALIGN="CENTER" COLSPAN=13>level 1</TD>
742 </TR>
743 <TR><TD ALIGN="CENTER" COLSPAN=6>frag 1</TD>
744 <TD ALIGN="CENTER" COLSPAN=3>frag 2</TD>
745 <TD ALIGN="CENTER" COLSPAN=3>frag 3</TD>
746 <TD ALIGN="CENTER">class 1</TD>
747 </TR>
748 <TR><TD ALIGN="CENTER">n1</TD>
749 <TD ALIGN="CENTER">n2</TD>
750 <TD ALIGN="CENTER">n3</TD>
751 <TD ALIGN="CENTER">rmsd</TD>
752 <TD ALIGN="CENTER">q</TD>
753 <TD ALIGN="CENTER">ang</TD>
754 <TD ALIGN="CENTER">rmsd</TD>
755 <TD ALIGN="CENTER">q</TD>
756 <TD ALIGN="CENTER">ang</TD>
757 <TD ALIGN="CENTER">rmsd</TD>
758 <TD ALIGN="CENTER">q</TD>
759 <TD ALIGN="CENTER">ang</TD>
760 <TD ALIGN="CENTER">&nbsp;</TD>
761 </TR>
762 <TR><TD ALIGN="CENTER">4</TD>
763 <TD ALIGN="CENTER">10</TD>
764 <TD ALIGN="CENTER">21</TD>
765 <TD ALIGN="CENTER">0.6</TD>
766 <TD ALIGN="CENTER">0.33</TD>
767 <TD ALIGN="CENTER">16.7</TD>
768 <TD ALIGN="CENTER">3.6</TD>
769 <TD ALIGN="CENTER">0.42</TD>
770 <TD ALIGN="CENTER">56.3</TD>
771 <TD ALIGN="CENTER">0.7</TD>
772 <TD ALIGN="CENTER">0.12</TD>
773 <TD ALIGN="CENTER">16.5</TD>
774 <TD ALIGN="CENTER">737</TD>
775 </TR>
776 </TABLE>
777
778 <P>
779 <TABLE CELLPADDING=3 BORDER="1">
780 <TR><TD ALIGN="CENTER" COLSPAN=7>level 2</TD>
781 <TD ALIGN="CENTER" COLSPAN=3>level 3</TD>
782 <TD ALIGN="CENTER">&nbsp;</TD>
783 </TR>
784 <TR><TD ALIGN="CENTER">nc1</TD>
785 <TD ALIGN="CENTER">nc2</TD>
786 <TD ALIGN="CENTER">rmsd</TD>
787 <TD ALIGN="CENTER">q</TD>
788 <TD ALIGN="CENTER">rmsd</TD>
789 <TD ALIGN="CENTER">q</TD>
790 <TD ALIGN="CENTER">class 2</TD>
791 <TD ALIGN="CENTER">rmsd</TD>
792 <TD ALIGN="CENTER">q</TD>
793 <TD ALIGN="CENTER">class 3</TD>
794 <TD ALIGN="CENTER">class</TD>
795 </TR>
796 <TR><TD ALIGN="CENTER">9</TD>
797 <TD ALIGN="CENTER">0</TD>
798 <TD ALIGN="CENTER">1.6</TD>
799 <TD ALIGN="CENTER">0.20</TD>
800 <TD ALIGN="CENTER">4.3</TD>
801 <TD ALIGN="CENTER">0.20</TD>
802 <TD ALIGN="CENTER">20</TD>
803 <TD ALIGN="CENTER">0</TD>
804 <TD ALIGN="CENTER">4.0</TD>
805 <TD ALIGN="CENTER">2</TD>
806 <TD ALIGN="CENTER">737.20.2</TD>
807 </TR>
808 </TABLE>
809
810 <P>
811 where
812
813 <P>
814 <DL>
815 <DT></DT>
816 <DD>No - the number of the conformation.
817
818 <P>
819 </DD>
820 <DT></DT>
821 <DD>``whole molecule'' denotes the characteristics of the whole molecule q = 1-Wolynes'q.
822
823 <P>
824 </DD>
825 <DT></DT>
826 <DD>level 1, 2, and 3 denote the characteristics computed for the respective fragments as these levels.
827
828 <P>
829 </DD>
830 <DT></DT>
831 <DD>n1, n2, n3 - number of native contacts for a given segment.
832
833 <P>
834 </DD>
835 <DT></DT>
836 <DD>cl1, cl2, cl3 - group of segment classes for segments at level 1, 2, and 3, respectively.
837
838 <P>
839 </DD>
840 <DT></DT>
841 <DD>class - total class of the conformation.
842
843 <P>
844 </DD>
845 </DL>
846
847 <P>
848 The octal/quaternary/binary numbers denoting the class for a fragment at level 1, 2, and 3, respectively, are described in
849 (Oldziej et al., <I>J. Phys. Chem. B.</I>, <B>2004</B>, 108, 16934-16949).
850
851 <P>
852
853 <H2><A NAME="SECTION00045000000000000000"></A>
854 <A NAME="sect:whamoutfiles:histograms"></A>
855 <BR>
856 The histogram files
857 </H2>
858
859 <P>
860 The histogram file with names file_[par_yy][_slice_xx].hist where xx denotes the number of the slice and yy denotes the number of the parameter if SEPARATE_PARSET was specified in input contain histograms of q at replica temperatures and energy-parameter sets; with SEPARATE_PARSET histograms corresponding to subsequent parameter sets are saved in files with par_yy infixes. The histograms are multidimensional if q is a vector (usually, however, q corresponds to the entire molecule and, consequently, the histograms are one-dimensional). The histogram files are printed if histfile and histout was specified in the control data record.
861
862 <P>
863 Each line of a histogram file corresponds to a given (multidimensional) bin in q contains the following:
864
865 <P>
866
867 <UL>
868 <LI>
869  q<sub>1</sub>,...,q<sub>n</sub>
870  at a given bin (format f6.3 for each)
871
872 <P>
873 </LI>
874 <LI>histogram values for subsequent replica temperatures (format e20.10 for each)
875
876 <P>
877 </LI>
878 <LI>iparm (the number of parameter set; format i5)
879
880 <P>
881 </LI>
882 <LI>If SEPARATE_PARSET was not specified, the entries corresponding to each parameter follow one another.
883
884 <P>
885 </LI>
886 </UL>
887
888 <P>
889 The state density is printed to file(s) file[_slice_xx].ent. Each line contains the left boundary of the energy bin and ln(state density) followed by ``ent'' string. At present, the state density is calculated correctly only if one energy-parameter set is used.&lt;/p&gt;
890
891 <P>
892
893 <H2><A NAME="SECTION00046000000000000000"></A>
894 <A NAME="sect:whamoutfiles:rmsd-rgy"></A>
895 <BR>
896 The rmsd-radius of gyration potential of mean force files
897 </H2>
898
899 <P>
900 These files with names file[_par_yy][_slice_xx].rmsrgy contain the two-dimensional potentials of mean force in rmsd and radius of gyration at all replica-exchange temperatures and for all energy-parameter sets.
901 A line contains the left boundaries of the radius of gyration - rmsd bin (radius of gyration first) (format 2f8.2) and the PMF values at all replica-exchange temperatures (e14.5), followed by the number of the parameter set. 
902 With SEPARATE_PARSET, the PMFs corresponding to different parameter sets are printed to separate files.
903
904 <P>
905
906 <H2><A NAME="SECTION00047000000000000000"></A>
907 <A NAME="sect:whamoutfiles:PDB"></A>
908 <BR>
909 The PDB files
910 </H2>
911
912 <P>
913 The PDB files with names file_[slice_xx_]Tyyy.pdb, where Tyyy specifies a given replica temperature contain the conformations whose probabilities at replica temperature T sum to 0.99, after sorting the conformations 
914 by probabilities in descending order. The PDB files follow the standard format; see ftp://ftp.wwpdb.org/pub/pdb/doc/format_descriptions/Format_v33_Letter.pdf<FONT COLOR="#0000ff">ftp://ftp.wwpdb.org/pub/pdb/doc/format_descriptions</FONT>.
915 For single-chain proteins, an example is as follows:
916
917 <P>
918 <PRE>
919 REMARK CONF    9059 TEMPERATURE  330.0 RMS   8.86
920 REMARK DIMENSIONLESS FREE ENERGY   -1.12726E+02
921 REMARK ENERGY   -2.22574E+01 ENTROPY   -7.87818E+01
922 ATOM      1  CA  VAL     1       8.480   5.714 -34.044
923 ATOM      2  CB  VAL     1       9.803   5.201 -33.968
924 ATOM      3  CA  ASP     2       8.284   2.028 -34.925
925 ATOM      4  CB  ASP     2       7.460   0.983 -33.832
926 .
927 .
928 .
929 ATOM    115  CA  LYS    58      28.446  -3.448 -12.936
930 ATOM    116  CB  LYS    58      26.613  -4.175 -14.514
931 TER
932 CONECT    1    3    2
933 .
934 .
935 .
936 CONECT  113  115  114
937 CONECT  115  116
938 </PRE>
939
940 <P>
941 where
942
943 <P>
944 <DL>
945 <DT></DT>
946 <DD>CONF is the number of the conformation from the processed slice of MREMD trajectories.
947
948 <P>
949 </DD>
950 <DT></DT>
951 <DD>TEMPERATURE is the replica temperature.
952
953 <P>
954 </DD>
955 <DT></DT>
956 <DD>RMS is the Calpha rmsd from the reference (experimental) structure.
957
958 <P>
959 </DD>
960 <DT></DT>
961 <DD>DIMENSIONLESS FREE ENERGY is -log(probability) (equation 14 of ref 2) for the conformation at this replica temperature calculated by WHAM.
962
963 <P>
964 </DD>
965 <DT></DT>
966 <DD>ENERGY is the UNRES energy of the conformation at the replica temperature (note that UNRES energy is in general temperature dependent).
967
968 <P>
969 </DD>
970 <DT></DT>
971 <DD>ENTROPY is the omega of equation 15 of ref 2 of the conformation.
972
973 <P>
974 </DD>
975 </DL>
976
977 <P>
978 In the ATOM entries, CA denotes a Calpha atom and CB denotes UNRES side-chain atom. The CONECT entries specify the 
979 C
980 <sup>&alpha;</sup>
981 <sub>i</sub>
982 ... C
983 <sup>&alpha;</sup>
984 <sub>i-1</sub>
985 , C
986 <sup>&alpha;</sup>
987 <sub>i</sub>
988 ... C
989 <sup>&alpha;</sup>
990 <sub>i+1</sub>
991  and C
992 <sup>&alpha;</sup>
993 <sub>i</sub>
994 ... SC
995 <sub>i</sub>
996  links.
997
998 <P>
999 The PDB files generated for oligomeric proteins are similar except that chains are separated with TER and molecules with ENDMDL records and chain identifiers are included. An example is as follows:
1000
1001 <P>
1002 <PRE>
1003 REMARK CONF     765 TEMPERATURE  301.0 RMS  11.89
1004 REMARK DIMENSIONLESS FREE ENERGY   -4.48514E+02
1005 REMARK ENERGY   -3.58633E+02 ENTROPY    1.51120E+02
1006 ATOM      1  CA  GLY A   1      -0.736  11.305  24.600
1007 ATOM      2  CA  TYR A   2      -3.184   9.928  21.998
1008 ATOM      3  CB  TYR A   2      -1.474  10.815  20.433
1009 .
1010 .
1011 .
1012 ATOM     40  CB  MET A  21      -4.033  -2.913  27.189
1013 ATOM     41  CA  GLY A  22      -5.795 -10.240  27.249
1014 TER
1015 ATOM     42  CA  GLY B   1       6.750  -6.905  19.263
1016 ATOM     43  CA  TYR B   2       5.667  -4.681  16.362
1017 .
1018 .
1019 .
1020 ATOM    163  CB  MET D  21       4.439  12.326  -4.950
1021 ATOM    164  CA  GLY D  22      10.096  14.370  -9.301
1022 TER
1023 CONECT    1    2
1024 CONECT    2    4    3
1025 .
1026 .
1027 .
1028 CONECT   39   41   40
1029 CONECT   42   43
1030 .
1031 .
1032 .
1033 CONECT  162  164  163
1034 ENDMDL
1035 </PRE>
1036
1037 <P>
1038
1039 <H2><A NAME="SECTION00048000000000000000"></A>
1040 <A NAME="sect:whamoutfiles:cx"></A>
1041 <BR>
1042 The compressed Cartesian coordinates (cx) files
1043 </H2>
1044
1045 <P>
1046 These files contain compressed data in the Europort Data Compression XDRF library format written by Dr. F. van Hoesel, Groeningen University (http://hpcv100.rc.rug.nl/xdrfman.htmlhttp://hpcv100.rc.rug.nl/xdrfman.html.
1047 The files are written by the cxwrite subroutine. The resulting cx file contains the omega factors to compute probabilities of conformations at any temperature and any energy-function parameters if Hamiltonian replica 
1048 exchange was performed in the preceding UNRES run. The files have general names file[_par_yy][_slice_xx].cx where xx is slice number and yy is parameter-set.
1049
1050 <P>
1051 The items written to the cx file are as follows (the precision is 5 significant digits):
1052
1053 <P>
1054
1055 <OL>
1056 <LI>Cartesian coordinates of Calpha and SC sites&lt;/p&gt;
1057 </LI>
1058 <LI>nss (number of disulfide bonds)
1059 </LI>
1060 <LI>if nss&gt;0:
1061
1062 <OL>
1063 <LI>ihpb (first residue of a disulfide link)
1064 </LI>
1065 <LI>jhpb (second residue of a disulfide link)
1066 </LI>
1067 <LI>UNRES energy at that replica temperature that the conformation was at snapshot-recording time,
1068 </LI>
1069 <LI>ln(omega) of eq 15 of (Liwo et al., <I>J. Phys. Chem. B</I>, <B>2007</B>, 111, 260-285),
1070 </LI>
1071 </OL>
1072 </LI>
1073 <LI>C&alpha; rmsd
1074 </LI>
1075 <LI>conformation class number (0 if CLASSIFY was not specified).
1076 </LI>
1077 </OL>
1078
1079 <P>
1080
1081 <H1><A NAME="SECTION00050000000000000000"></A>
1082 <A NAME="sect:clustoutfiles"></A>
1083 <BR>
1084 CLUSTER OUTPUT FILES
1085 </H1>
1086
1087 <P>
1088
1089 <H2><A NAME="SECTION00051000000000000000"></A>
1090 <A NAME="sect:clustoutfiles:summary"></A>
1091 <BR>
1092 Summary of files
1093 </H2>
1094
1095 <P>
1096 <DL>
1097 <DT></DT>
1098 <DD>file_clust.out (single-processor mode) or file_clust.out_xxx (parallel mode) -
1099      output file(s) (file.out_000 is the main output file for parallel mode).
1100
1101 <P>
1102 </DD>
1103 <DT></DT>
1104 <DD>file_clust.int - leading (lowest-energy) members of the families.
1105     in internal-coordinate format.
1106 </DD>
1107 <DT></DT>
1108 <DD>file_clust.x - leading members of the families in UNRES Cartesian coordinate
1109     format.
1110 </DD>
1111 <DT></DT>
1112 <DD>file_xxxx.pdb or file_xxxx_yyy.pdb (CLUST-UNRES) - PDB file of member yyy
1113     of family xxxx; yyy is omitted if the family contains only one member
1114     within a given energy cut-off.
1115 </DD>
1116 <DT></DT>
1117 <DD>file_TxxxK_yyyy.pdb - concatenated conformations in PDB format of the 
1118     members of family yyyy clustered at T=xxxK ranked by probabilities in
1119     descending order at this temperature (CLUST-WHAM).
1120 </DD>
1121 <DT></DT>
1122 <DD>file_T_xxxK_ave.pdb - cluster-averaged coordinates and coordinates of a 
1123     member of each family that is closest to the cluster average in PDB
1124     format, concatenated in a single file (CLUST-WHAM).
1125
1126 <P>
1127 </DD>
1128 <DT></DT>
1129 <DD>file_clust.tex - PicTeX code of the cluster tree (effectively obsolete).
1130
1131 <P>
1132 </DD>
1133 <DT></DT>
1134 <DD>file.rms - rmsds between conformations.
1135
1136 <P>
1137 </DD>
1138 </DL>
1139
1140 <P>
1141
1142 <H2><A NAME="SECTION00052000000000000000"></A>
1143 <A NAME="sect:clustutfiles:outcoord"></A>
1144 <BR>
1145 Output coordinate files
1146 </H2>
1147
1148 <P>
1149
1150 <H3><A NAME="SECTION00052100000000000000"></A>
1151 <A NAME="sect:clustoutfiles:int"></A>
1152 <BR>
1153 The internal coordinate (int) files
1154 </H3>
1155
1156 <P>
1157 The file with name file_clust.int contains the angles theta, gamma, alpha,
1158 and beta of all residues of the leaders (lowest UNRES energy conformations
1159 from consecutive families for CLUST-UNRES runs and lowest free energy 
1160 conformations for CLUST-WHAM runs). The format is the same as that of the 
1161 file output by UNRES; see section 9.1.1 of UNRES description.
1162
1163 <P>
1164 For CLUST-WHAM runs, the first line contains more items:
1165
1166 <P>
1167 <TABLE CELLPADDING=3>
1168 <TR><TD ALIGN="LEFT">number of family</TD>
1169 <TD ALIGN="LEFT">(format i5)</TD>
1170 </TR>
1171 <TR><TD ALIGN="LEFT">UNRES free energy of the conformation</TD>
1172 <TD ALIGN="LEFT">(format f12.3)</TD>
1173 </TR>
1174 <TR><TD ALIGN="LEFT">Free energy of the entire family</TD>
1175 <TD ALIGN="LEFT">(format f12.3)</TD>
1176 </TR>
1177 <TR><TD ALIGN="LEFT">number of disulfide bonds</TD>
1178 <TD ALIGN="LEFT">(format i2)</TD>
1179 </TR>
1180 <TR><TD ALIGN="LEFT">list disulfide-bonded pairs</TD>
1181 <TD ALIGN="LEFT">(format 2i3)</TD>
1182 </TR>
1183 <TR><TD ALIGN="LEFT">conformation class number (0 if not provided)</TD>
1184 <TD ALIGN="LEFT">(format i10)</TD>
1185 </TR>
1186 </TABLE>
1187
1188 <P>
1189
1190 <H3><A NAME="SECTION00052200000000000000"></A>
1191 <A NAME="sect:clustoutfiles:card"></A>
1192 <BR>
1193 The Cartesian coordinate (x) files
1194 </H3>
1195
1196 <P>
1197 The file with name file_clust.x contains the Cartesian coordinates of the 
1198 alpha-carbon and side-chain-center coordinates. The coordinate format is
1199 as in section 9.1.2 of UNRES description and the first line contains the
1200 following items:
1201
1202 <P>
1203 <TABLE CELLPADDING=3>
1204 <TR><TD ALIGN="LEFT">Number of the family</TD>
1205 <TD ALIGN="LEFT">(format I5)</TD>
1206 </TR>
1207 <TR><TD ALIGN="LEFT">UNRES free energy of the conformation</TD>
1208 <TD ALIGN="LEFT">(format f12.3)</TD>
1209 </TR>
1210 <TR><TD ALIGN="LEFT">Free energy of the entire family</TD>
1211 <TD ALIGN="LEFT">(format f12.3)</TD>
1212 </TR>
1213 <TR><TD ALIGN="LEFT">number of disulfide bonds</TD>
1214 <TD ALIGN="LEFT">(format i2)</TD>
1215 </TR>
1216 <TR><TD ALIGN="LEFT">list disulfide-bonded pairs</TD>
1217 <TD ALIGN="LEFT">(format 2i3)</TD>
1218 </TR>
1219 <TR><TD ALIGN="LEFT">conformation class number (0 if not provided)</TD>
1220 <TD ALIGN="LEFT">(format i10)</TD>
1221 </TR>
1222 </TABLE>
1223
1224 <P>
1225
1226 <H3><A NAME="SECTION00052300000000000000"></A>
1227 <A NAME="sect:clustoutfiles:PDB"></A>
1228 <BR>
1229 The PDB files
1230 </H3>
1231
1232 <P>
1233 The PDB files are in standard format (see 
1234 ftp://ftp.wwpdb.org/pub/pdb/doc/format_descriptions/Format_v33_Letter.pdfftp://ftp.wwpdb.org/pub/pdb/doc/format_descriptions).
1235 The ATOM records contain Calpha coordinates (CA) or UNRES side-chain-center
1236 coordinates (CB). For oligomeric proteins chain identifiers are present
1237 (A, B, ..., etc.) and each chain ends with a TER record. Coordinates of a 
1238 single conformation or multiple conformations  The header (REMARK) records 
1239 and the contents depends on cluster run type. The next subsections are devoted 
1240 to different run types. 
1241
1242 <P>
1243 The program generates a file for each family of conformations and a summary
1244 file with ensemble-averaged conformations for all families. These are described
1245 in the two next sections.
1246
1247 <P>
1248
1249 <H4><A NAME="SECTION00052310000000000000"></A>
1250 <A NAME="sect:clustoutfiles:PDB:clust-unres:family"></A>
1251 <BR>
1252 Conformation family files
1253 <BR>
1254 <BR>
1255 </H4>
1256
1257 <P>
1258 For each family, the file name is file_TxxxK_yyyy.pdb, where yyyy is the
1259 number of the family and xxx is the integer part of the temperature (K).
1260 The first REMARK line in the file contains the information about the free
1261 energy and average rmsd of the entire cluster and, for each conformation,
1262 the initial REMARK line contains these quantities for this conformation.
1263 Same applies to oligomeric proteins, for which the TER records separate the 
1264 chains and the ENDMDL record separates conformations.
1265 An example is given below. 
1266
1267 <P>
1268 <PRE>
1269 REMARK CLUSTER    1 FREE ENERGY  -7.65228E+01 AVE RMSD 8.22
1270 REMARK 1BDD L18G full clust ENERGY    -7.33241E+01 RMS  10.40
1271 ATOM      1  CA  VAL     1      18.059 -33.585   4.616  1.00  5.00
1272 ATOM      2  CB  VAL     1      18.720 -32.797   3.592  1.00  5.00
1273 .
1274 .
1275 .
1276 ATOM    115  CA  LYS    58      29.641 -44.596  -8.159  1.00  5.00
1277 ATOM    116  CB  LYS    58      27.593 -45.927  -8.930  1.00  5.00
1278 TER
1279 CONECT    1    3    2
1280 CONECT    3    5    4
1281 .
1282 .
1283 CONECT  113  114
1284 CONECT  115  116
1285 TER
1286 REMARK 1BDD L18G full clust ENERGY    -7.33240E+01 RMS  10.04
1287 ATOM      1  CA  VAL     1       3.174   2.833 -34.386  1.00  5.00
1288 ATOM      2  CB  VAL     1       3.887   2.811 -33.168  1.00  5.00
1289 .
1290 .
1291 ATOM    115  CA  LYS    58      16.682   6.695 -20.438  1.00  5.00
1292 ATOM    116  CB  LYS    58      18.925   5.540 -20.776  1.00  5.00
1293 TER
1294 CONECT    1    3    2
1295 CONECT    3    5    4
1296 CONECT  113  114
1297 CONECT  115  116
1298 TER
1299 </PRE>
1300
1301 <P>
1302
1303 <H4><A NAME="SECTION00052320000000000000"></A>
1304 <A NAME="sect:clustoutfiles:PDB:clust-unres:average"></A>
1305 <BR>
1306 Average-structure file
1307 <BR>
1308 <BR>
1309 </H4>
1310
1311 <P>
1312 The file name is file_T_xxxK_ave.pdb. The entries are in pairs; the first
1313 one is cluster-averaged conformation and the second is a family member which
1314 has the lowest rmsd from this average conformation. Computing average 
1315 conformations is explained in section 2.5 of ref 3. Example excerpts from
1316 an entry corresponding to a given family are shown below.
1317
1318 <P>
1319 <PRE>
1320 REMAR AVERAGE CONFORMATIONS AT TEMPERATURE  300.00
1321 REMARK CLUSTER    1
1322 REMARK 2HEP clustering 300K ENERGY    -8.22572E+01 RMS   3.29
1323 ATOM      1  CA  MET     1     -17.748  48.148 -19.284  1.00  5.96
1324 ATOM      2  CB  MET     1     -17.373  47.911 -19.294  1.00  6.34
1325 ATOM      3  CA  ILE     2     -18.770  49.138 -18.133  1.00  3.98
1326 .
1327 .
1328 .
1329 ATOM     80  CB  PHE    41     -14.353  44.680 -15.642  1.00  2.62
1330 ATOM     81  CA  ARG    42     -11.619  41.645 -13.117  1.00  4.06
1331 ATOM     82  CB  ARG    42     -11.330  40.378 -13.313  1.00  5.19
1332 TER
1333 CONECT    1    3    2
1334 CONECT    3    5    4
1335 .
1336 .
1337 .
1338 CONECT   76   78   77
1339 CONECT   78   79
1340 CONECT   79   80
1341 CONECT   81   82
1342 TER
1343 REMARK 2HEP clustering 300K ENERGY    -8.22572E+01 RMS   3.29
1344 ATOM      1  CA  MET     1     -37.698  40.489 -32.408  1.00  5.96
1345 ATOM      2  CB  MET     1     -38.477  39.426 -34.159  1.00  6.34
1346 .
1347 .
1348 .
1349 ATOM     80  CB  PHE    41     -35.345  50.342 -31.371  1.00  2.62
1350 ATOM     81  CA  ARG    42     -33.603  54.332 -27.130  1.00  4.06
1351 ATOM     82  CB  ARG    42     -33.832  53.074 -24.415  1.00  5.19
1352 TER
1353 CONECT    1    3    2
1354 CONECT    3    5    4
1355 .
1356 .
1357 .
1358 CONECT   76   78   77
1359 CONECT   78   79
1360 CONECT   79   80
1361 CONECT   81   82
1362 TER
1363 </PRE>
1364
1365 <P>
1366
1367 <P><P>
1368 <BR>
1369
1370 <P>
1371 Prepared by Adam Liwo, 04/10/18
1372
1373 <P>
1374 <BR><HR>
1375
1376 {% endblock %}