output files description and changelog
[django_unres.git] / django_simple / todo / templates / outputs.html
1 <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN">
2
3 <!--Converted with LaTeX2HTML 2008 (1.71)
4 original version by:  Nikos Drakos, CBLU, University of Leeds
5 * revised and updated by:  Marcus Hennecke, Ross Moore, Herb Swan
6 * with significant contributions from:
7   Jens Lippmann, Marek Rouchal, Martin Wilck and others -->
8 <HTML>
9 <HEAD>
10 <TITLE>DESCRIPTION OF THE OUTPUT FILES FROM THE UNRES SERVER</TITLE>
11 <META NAME="description" CONTENT="DESCRIPTION OF THE OUTPUT FILES FROM THE UNRES SERVER">
12 <META NAME="keywords" CONTENT="outputs">
13 <META NAME="resource-type" CONTENT="document">
14 <META NAME="distribution" CONTENT="global">
15
16 <META NAME="Generator" CONTENT="LaTeX2HTML v2008">
17 <META HTTP-EQUIV="Content-Style-Type" CONTENT="text/css">
18
19 </HEAD>
20
21 <BODY >
22
23 <P>
24
25 <P>
26 <H1 ALIGN=CENTER>DESCRIPTION OF THE OUTPUT FILES FROM THE UNRES SERVER</H1>
27 </P>
28 <HR>
29
30 <P>
31
32 <P>
33 <BR>
34
35 <H2><A NAME="SECTION00010000000000000000">
36 Contents</A>
37 </H2>
38 <!--Table of Contents-->
39
40 <UL>
41 <LI><A NAME="tex2html30"
42   HREF="outputs.html#SECTION00020000000000000000">GENERAL INFORMATION</A>
43 <LI><A NAME="tex2html31"
44   HREF="outputs.html#SECTION00030000000000000000">UNRES OUTPUT FILES</A>
45 <UL>
46 <LI><A NAME="tex2html32"
47   HREF="outputs.html#SECTION00031000000000000000">The main output file(s)</A>
48 <LI><A NAME="tex2html33"
49   HREF="outputs.html#SECTION00032000000000000000">Coordinate files</A>
50 <LI><A NAME="tex2html34"
51   HREF="outputs.html#SECTION00033000000000000000">The summary (STAT) file</A>
52 </UL>
53 <BR>
54 <LI><A NAME="tex2html35"
55   HREF="outputs.html#SECTION00040000000000000000">WHAM OUTPUT FILES</A>
56 <UL>
57 <LI><A NAME="tex2html36"
58   HREF="outputs.html#SECTION00041000000000000000">Summary of the files</A>
59 <LI><A NAME="tex2html37"
60   HREF="outputs.html#SECTION00042000000000000000">The structure of the main output file (out)</A>
61 <LI><A NAME="tex2html38"
62   HREF="outputs.html#SECTION00043000000000000000">The thermodynamic quantity and ensemble average (thermal) files</A>
63 <LI><A NAME="tex2html39"
64   HREF="outputs.html#SECTION00044000000000000000">The conformation summary with classification (stat) files</A>
65 <LI><A NAME="tex2html40"
66   HREF="outputs.html#SECTION00045000000000000000">The histogram files</A>
67 <LI><A NAME="tex2html41"
68   HREF="outputs.html#SECTION00046000000000000000">The rmsd-radius of gyration potential of mean force files</A>
69 <LI><A NAME="tex2html42"
70   HREF="outputs.html#SECTION00047000000000000000">The PDB files</A>
71 <LI><A NAME="tex2html43"
72   HREF="outputs.html#SECTION00048000000000000000">The compressed Cartesian coordinates (cx) files</A>
73 </UL>
74 <BR>
75 <LI><A NAME="tex2html44"
76   HREF="outputs.html#SECTION00050000000000000000">CLUSTER OUTPUT FILES</A>
77 <UL>
78 <LI><A NAME="tex2html45"
79   HREF="outputs.html#SECTION00051000000000000000">Summary of files</A>
80 <LI><A NAME="tex2html46"
81   HREF="outputs.html#SECTION00052000000000000000">Output coordinate files</A>
82 </UL></UL>
83 <!--End of Table of Contents-->
84 <P>
85
86 <H1><A NAME="SECTION00020000000000000000"></A>
87 <A NAME="sect:general"></A>
88 <BR>
89 GENERAL INFORMATION
90 </H1>
91
92 <P>
93 The output files produced by the UNRES server are those from UNRES and, if MREMD calculations
94 were requested, also from WHAM and CLUSTER and the final all-atom model files. The file names
95 begin with file_ for UNRES, WHAM, and cluster, while the files with the final all-atom models are 
96 model01.pdb - model05.pdb. It should be noted that only the files correspoding to the 
97 calculation types available when using the UNRES server are described in this document and 
98 that, for non-server UNRES jobs,
99 other filename prefixes than file_ can be set; for details please see the 
100 <a href="http://www.unres.pl/docs">UNRES web page</a>.
101
102 <P>
103
104 <H1><A NAME="SECTION00030000000000000000"></A>
105 <A NAME="sect:output"></A>
106 <BR>
107 UNRES OUTPUT FILES
108 </H1>
109
110 <P>
111
112 <H2><A NAME="SECTION00031000000000000000"></A>
113 <A NAME="sect:output:main"></A>
114 <BR>
115 The main output file(s)
116 </H2>
117
118 <P>
119 UNRES ``main'' output files (file.out_${POT}[processor], where, by defalut, ${POT}&nbsp;=&nbsp;GB,
120 the Gay-Berne-type sidechain-sidechain interaction potential) 
121 are log files from
122 a run. They contain the information of the molecule, force field, calculation
123 type, control parameters, etc.; however, not the structures produced during
124 the run or their energies except single-point energy evaluation and 
125 minimization-related runs. 
126
127 <P>
128
129 <H2><A NAME="SECTION00032000000000000000"></A>
130 <A NAME="sect:output:coord"></A>
131 <BR>
132 Coordinate files
133 </H2>
134
135 <P>
136 The structural information is included in 
137 coordinate files (*.int, *.x, *.pdb, *.mol2, *.cx) and statistics files (*.stat), 
138 respectively; these files are further processed by WHAM and
139 CLUSTER or can be viewed by molecular viewers (pdb or mol2 files).
140
141 <P>
142
143 <H3><A NAME="SECTION00032100000000000000"></A>
144 <A NAME="sect:output:coord:int"></A>
145 <BR>
146 The internal coordinate (INT) file
147 </H3>
148
149 <P>
150 This file contains the internal coordinates of the conformations produced 
151 by UNRES in non-MD runs. The virtual-bond lengths are assumed constant so
152 only the angular variables are provided.
153
154 <P>
155 IT,ENER,NSS,(IHPB(I),JHPB(I),I=1,NSS)
156 <BR>(I5,F12.5,I2,9(1X,2I3))
157
158 <P>
159 <DL>
160 <DT></DT>
161 <DD>IT - the number of the conformation.
162 </DD>
163 <DT></DT>
164 <DD>ENER - total energy.
165 </DD>
166 <DT></DT>
167 <DD>NSS - the number of disulfide bridges.
168 </DD>
169 <DT></DT>
170 <DD>(IHPB(I),JHPB(I),I=1,NSS) - the positions of the pairs of half-cystines .
171 forming the bridges. If NSS &gt; 9, the remaining pairs are written in the 
172 following lines in the (3X,11(1X,2I3)) format.
173 </DD>
174 </DL>
175
176 <P>
177 (THETA(I),I=3,NRES)
178 <BR>(8F10.4)
179
180 <P>
181 The virtual-bond angles THETA (in degrees)
182
183 <P>
184 (PHI(I),I=4,NRES)
185 <BR>(8F10.4)
186
187 <P>
188 The virtual-bond dihedral angles GAMMA (in degrees)
189
190 <P>
191 (ALPH(I),I=2,NRES-1)
192 <BR>(OMEG(I),I=2,NRES-1)
193 <BR>(8F10.4)
194
195 <P>
196 The polar angles ALPHA and BETA of the side-chain centers (in degrees).
197
198 <P>
199
200 <H3><A NAME="SECTION00032200000000000000"></A> 
201 <A NAME="sect:output:coord:cart"></A>
202 <BR>
203 The plain Cartesian coordinate (X) files
204 </H3>
205
206 <P>
207 (Subroutine CARTOUT.)
208
209 <P>
210 This file contains the Cartesian coordinates of the 
211 &alpha;-carbon and
212 side-chain-center coordinates. All conformations from an MD/MREMD
213 trajectory are collated to a single file. The structure of each
214 conformation's record is as follows:
215
216 <P>
217 1st line: time, potE, uconst, t_bath,nss, (ihpb(j), jhpb(j), j=1,nss),
218 nrestr, (qfrag(i), i=1,nfrag), (qpair(i), i=1,npair),
219 (utheta(i), ugamma(i), uscdiff(i), i=1,nfrag_back)
220
221 <P>
222 <DL>
223 <DT></DT>
224 <DD>time: MD time (in ``molecular time units'' 1 mtu = 48.9 fs),
225 </DD>
226 <DT></DT>
227 <DD>potE: potential energy,
228 </DD>
229 <DT></DT>
230 <DD>uconst: restraint energy corresponding to restraints on Q and backbone geometry,
231 </DD>
232 <DT></DT>
233 <DD>t_bath: thermostat temperature,
234 </DD>
235 <DT></DT>
236 <DD>nss: number of disulfide bonds,
237 </DD>
238 <DT></DT>
239 <DD>ihpb(j), jhpb(j): the numbers of linked cystines for jth disulfide bond,
240 </DD>
241 <DT></DT>
242 <DD>nrestr: number of restraints on q and local geometry,
243 </DD>
244 <DT></DT>
245 <DD>qfrag(i): q value for ith fragment,
246 </DD>
247 <DT></DT>
248 <DD>qpair(i): q value for ith pair,
249 </DD>
250 <DT></DT>
251 <DD>utheta(i): sum of squares of the differences between the theta angles 
252    of the current conformation from those of the experimental conformation,
253 </DD>
254 <DT></DT>
255 <DD>ugamma(i): sum of squares of the differences beaten the gamma angles 
256    of the current conformation from those of the experimental conformation,
257 </DD>
258 <DT></DT>
259 <DD>uscdiff(i): sum of squares of the differences between the Cartesian difference
260    of the unit vector of the C&alpha;
261 -SC axis of the current conformation from 
262    those of the experimental conformation.
263 </DD>
264 </DL>
265
266 <P>
267 Next lines: Cartesian coordinates of the C&alpha;
268  atoms (including dummy atoms)
269 (sequentially, 10 coordinates per line)
270 Next lines: Cartesian coordinates of the SC atoms (including glycines and
271 dummy atoms) (sequentially, 10 coordinates per line)
272
273 <P>
274
275 <H3><A NAME="SECTION00032300000000000000"></A>
276 <A NAME="sect:output:coord:cx"></A>
277 <BR>
278 The compressed Cartesian coordinate (CX) files
279 </H3>
280
281 <P>
282 These files are compressed binary files (extension cx). For each conformation, 
283 the items are written in the same order as specified in section <A HREF="#sect:output:coord:cx">2.2.3</A>. For 
284 MREMD runs, if TRAJ1FILE is specified on MREMD record,
285 snapshots from all trajectories are written every time the coordinates
286 are dumped. Thus, the file contains snapshot 1 from trajectory 1, ...,
287 snapshot 1 from trajectory M, snapshot 2 from trajectory 1, ..., etc.
288
289 <P>
290 The compressed cx files can be converted to pdb file by using the xdrf2pdb
291 auxiliary program (single trajectory files) or xdrf2pdb-m program (multiple
292 trajectory files from MREMD runs generated by using the TRAJ1FILE option).
293 The multiple-trajectory cx files are also input files for the auxiliary
294 WHAM program.
295
296 <P>
297
298 <H3><A NAME="SECTION00032400000000000000"></A>
299 <A NAME="sect:output:coord:PDB"></A>
300 <BR>
301 The Brookhaven Protein Data Bank format (PDB) files
302 </H3>
303
304 <P>
305 (Subroutine PDBOUT.)
306
307 <P>
308 These files are written in PDB standard (see. e.g., 
309 ftp://ftp.wwpdb.org/pub/pdb/doc/format_descriptions/Format_v33_Letter.pdf<FONT COLOR="#0000ff">ftp://ftp.wwpdb.org/pub/pdb/doc/format_descriptions</FONT>). The REMARK, ATOM, SSBOND, HELIX, SHEET, CONECT, TER, and ENDMDL are used.
310 The C&alpha;
311  (marked CA) and SC (marked CB) coordinates are output. The CONECT
312 records specify the C&alpha; - C&alpha; and C&alpha; - SC virtual bonds. Secondary
313 structure is detected based on peptide-group contacts, as specified in 
314 ref 12. Dummy residues are omitted from the output. If the program has
315 multiple-chain function, the presence of a dummy residue in a sequence 
316 starts a new chain, which is assigned the next alphabet letter as ID, and
317 residue numbering is started over.
318
319 <P>
320
321 <H3><A NAME="SECTION00032500000000000000"></A>
322 <A NAME="sect:output:coord:subyll"></A>
323 <BR>
324 The SYBYLL (MOL2) files
325 </H3>
326
327 <P>
328 See the description of mol2 format (e.g., 
329 http://tripos.com/data/support/mol2.pdfhttp://tripos.com/data/support/mol2.pdf. 
330 Similar remarks apply as for
331 the PDB format (section <A HREF="#sect:output:coord:PDB">2.2.4</A>). 
332
333 <P>
334
335 <H2><A NAME="SECTION00033000000000000000">
336 The summary (STAT) file</A>
337 </H2>
338
339 <P>
340 Each line of the stat file generated by MD/MREMD runs contains the following
341 items in sequence:
342
343 <P>
344 <DL>
345 <DT></DT>
346 <DD>step   - the number of the MD step 
347 </DD>
348 <DT></DT>
349 <DD>time   - time [unit is MTU (molecular time unit) equal to 48.9 fs]        
350 </DD>
351 <DT></DT>
352 <DD>Ekin   - kinetic energy [kcal/mol]        
353 </DD>
354 <DT></DT>
355 <DD>Epot   - potential energy [kcal/mol]
356 </DD>
357 <DT></DT>
358 <DD>Etot   - total energy (Ekin+Epot)
359 </DD>
360 <DT></DT>
361 <DD>H-H0   - the difference between the cureent and initial extended Hamiltionian
362          in Nose-Hoover or Nose-Poincare runs; not present for other thermostats.
363 </DD>
364 <DT></DT>
365 <DD>RMSD   - root mean square deviation from the reference structure (only in 
366          REFSTR has been specified)
367 itemdamax  - maximum change of acceleration between two MD steps
368 </DD>
369 <DT></DT>
370 <DD>fracn  - fraction of native side-chain concacts (very crude, based on 
371          SC-SC distance only)
372 </DD>
373 <DT></DT>
374 <DD>fracnn - fraction of non-native side-chain contacts
375 </DD>
376 <DT></DT>
377 <DD>co     - contact order
378 </DD>
379 <DT></DT>
380 <DD>temp   - actual temperature [K]    
381 </DD>
382 <DT></DT>
383 <DD>T0     - initial (microcanonical runs) or thermostat (other run types) 
384          temperature [K] 
385 </DD>
386 <DT></DT>
387 <DD>Rgyr   - radius of gyration based on C&alpha; coordinates [A]   
388 </DD>
389 <DT></DT>
390 <DD>proc   - in MREMD runs the number of the processor (the number of the 
391          trajectory less 1); not present for other runs. 
392 </DD>
393 </DL>
394
395 <P>
396 For an USAMPL run, the following items follow the above list:
397
398 <P>
399 <DL>
400 <DT></DT>
401 <DD>iset   - the number of the restraint set
402 </DD>
403 <DT></DT>
404 <DD>uconst - restraint energy pertaining to q-values 
405 </DD>
406 <DT></DT>
407 <DD>uconst_back - restraint energy pertaining to virtual-backbone restraints
408 </DD>
409 <DT></DT>
410 <DD>(qfrag(i),i=1,nfrag) - q values of the specified fragments
411 </DD>
412 <DT></DT>
413 <DD>(qpair(ii2),ii2=1,npair) - q values of the specified pairs of fragments
414 </DD>
415 <DT></DT>
416 <DD>(utheta(i),ugamma(i),uscdiff(i),i=1,nfrag_back) - virtual-backbone and
417       side-chain-rotamer restraint energies of the fragments specified
418 </DD>
419 </DL>
420
421 <P>
422 If PRINT_COMPON has been specified, the energy components are printed
423 after the items described above.
424
425 <P>
426
427 <H1><A NAME="SECTION00040000000000000000"></A>
428 <A NAME="sect:whamoutfiles"></A>
429 <BR>
430 WHAM OUTPUT FILES
431 </H1>
432
433 <P>
434
435 <H2><A NAME="SECTION00041000000000000000"></A>
436 <A NAME="sect:whamoutfiles:summary"></A>
437 <BR>
438 Summary of the files
439 </H2>
440
441 <P>
442 <DL>
443 <DT></DT>
444 <DD>file.out_POTxxx - output files from different processors (file.out_000 is the main output file). POT is the identifier of the sidechain-sidechain potential.
445
446 <P>
447 </DD>
448 <DT></DT>
449 <DD>file_POT_GB_xxx.stat or file_POT_slice_YYXXX.stat - the summary conformation-classification file from processor xxx (each processor handles part of conformations); the second occurs if the run is partitioned into slices.
450
451 <P>
452 </DD>
453 <DT></DT>
454 <DD>file.thermal or file_slice_yy.thermal - thermodynamic functions and temperature profiles of the ensemble averages (the second form if the run is partitioned into slices).
455
456 <P>
457 </DD>
458 <DT></DT>
459 <DD>file_T_xxx.pdb or file_slice_yy_T_xxx.pdb - top conformations the number of these conformations is selected by the user) in PDB format.
460
461 <P>
462 </DD>
463 <DT></DT>
464 <DD>file.cx - the compressed UNRES coordinate file with information to compute the probability of a given conformation at any temperature.
465
466 <P>
467 </DD>
468 <DT></DT>
469 <DD>file.hist, file_slice_xx.hist, file_par_yy.hist, file_par_yy_slice_zz.x - histograms of q at MREMD temperatures.
470
471 <P>
472 </DD>
473 <DT></DT>
474 <DD>file.ent, file_slice_xx.ent, file_par_yy.ent, file_par_yy_slice_xx.ent - the histogram(s) of energy density.
475
476 <P>
477 </DD>
478 <DT></DT>
479 <DD>file.rmsrgy, file_par_yy.rmsrgy, file_slice_xx.rmsrgy or file_par_yy_slice_xx.rmsrgy - the 2D histogram(s) of rmsd from the experimental structure and radius of gyration.
480
481 <P>
482 </DD>
483 </DL>
484
485 <P>
486
487 <H3><A NAME="SECTION00041100000000000000"></A>
488 <A NAME="sect:whamoutfile:main:reference"></A>
489 <BR>
490 Information of reference structure and comparing scheme
491 </H3>
492
493 <P>
494 The following records pertain to setting up the classification of conformation aimed ultimately at obtaining a class numbers. Fragments and pairs of fragments are specified and compared against those of reference structure in terms of secondary structure, number of contacts, rmsd, virtual-bond-valence and dihedral angles, etc. Then the class number is constructed as described in ref 3. A brief description of comparison procedure is as follows:
495
496 <P>
497
498 <OL>
499 <LI>Elementary fragments usually corresponding to elements of secondary or supersecondary structure are selected. Based on division into fragments, levels of structural hierarchy are defined.
500
501 <P>
502 </LI>
503 <LI>At level 1, each fragment is checked for agreement with the corresponding fragment in the native structure. Comparison is carried out at two levels: the secondary structure agreement and the contact-pattern agreement level.
504
505 <P>
506 At the secondary structure level the secondary structure (helix, strand or undefined) in the fragment is compared with that in the native fragment in a residue-wise manner. Score 0 is assigned if the structure is different in more than 1/3 of the fragment, 1 is assigned otherwise.
507
508 <P>
509 The contact-pattern agreement level compares the contacts between the peptide groups of the backbone of the fragment and the native fragment and also compares their virtual-bond dihedral angles gamma. It is allowed to shift the sequence by up to 3 residues to obtain contact pattern match. A score of 0 is assigned if more than 1/3 of native contacts do not occur or there is more than 60 deg (usually, but this cutoff can be changed) maximum difference in gamma. Otherwise score 1 is assigned.
510
511 <P>
512 The total score of a fragment is an octal number consisting of bits hereafter referred to S (secondary structure) C (contact match) and H (sHift) (they are in the order HCS). Their values are as follows:
513
514 <P>
515 <DL>
516 <DT></DT>
517 <DD>S - 1 native secondary structure; 0 otherwise,
518 </DD>
519 <DT></DT>
520 <DD>C - 1 native contact pattern; 0 otherwise,
521 </DD>
522 <DT></DT>
523 <DD>H - 1 contact match obtained without sequence shift 0 otherwise.
524 </DD>
525 </DL>
526
527 <P>
528 For example,
529 octal 7 (111) corresponds to native secondary structure, native contact pattern, and no need to shift the sequence for contact match;
530 octal 1 (001) corresponds to native secondary structure only (i.e., nonnative contact pattern).
531
532 <P>
533 </LI>
534 <LI>At level 2, contacts between (i) the peptide groups or (ii) the side chains within pairs of fragments are compared. Case (i) holds when we seek contacts between the strands of a larger beta-sheet formed by two fragments, case (ii) when we seek the interhelix or helix-beta sheet contacts. Additionally, the pairs of fragments are compared with their native counterparts by rmsd.
535
536 <P>
537 Score 0 is assigned to a pair of fragments, if it has less than 2/3 native contacts and too large rmsd (a cut-off of 0.1 A/residue is set), score 1 if it has enough native contacts and sufficiently low rmsd, but the sequence has to be shifted to obtain a match, and score 2, if sufficient match is obtained without shift.
538
539 <P>
540 </LI>
541 <LI>At level 3 and higher, triads, quadruplets,..., etc. of fragments are compared in terms of rmsd from their native counterparts (the last level corresponds to comparing whole molecules). The score (0, 1, or 2) is assigned to each composite fragment as in the case of level 2.
542
543 <P>
544 </LI>
545 <LI>The TOTAL class number of a structure is a binary number composed of parts of scores of fragments, fragment pairs, etc. It is illustrated on the following example; it is assumed that the molecule has three fragment as in the case of 1igd.
546
547 <P>
548 </LI>
549 </OL>
550
551 <P>
552 <PRE>
553 level 1      level 2                   level 3
554 123 123 123||1-2 1-3 2-3 1-2 1-3 2-3 || 1-2-3 | 1-2-3 ||
555 sss|ccc|hhh|| c   c   c | h   h   h  ||   r   |   h   ||
556 </PRE>
557
558 <P>
559 Bits s, c, and h of level 1 are explained in point 2; bits c and h of level 2 pertain to contact-pattern match and shift; bits r and h of level 3 pertain to rmsd match and shift for level 3.
560
561 <P>
562
563 <H2><A NAME="SECTION00042000000000000000"></A>
564 <A NAME="sect:whamoutfiles:output:main"></A>
565 <BR>
566 The structure of the main output file (out)
567 </H2>
568
569 <P>
570 The initial portion of the main output file, named file.out_POT_000 contains information of parameter files specified in the C-shell script, compilation info, and the UNRES numeric code of the amino-acid sequence.
571 Subsequently, actual energy-term weights and parameter files are printed. If lprint was set at .true. in parmread.F, all energy-function parameters are printed. If REFSTR was specified in the control-data list, the program then outputs the read reference-structure coordinates and partition of structure into fragments.
572 Subsequently, the information about the number of structures read in and those that were rejected is printed followed by succinct information form the iteration process. Finally, the histograms (also output separately to specific histogram files; see section 6.6) and the data of the dependence of free energy, energy, heat capacity, and conformational averages on temperature are printed (these are also output separately to file described in section <A HREF="#sect:whamoutfiles:histograms">3.5</A>).
573
574 <P>
575 The output files corresponding to non-master processors (file.out_POT_xxx where xxx
576  &gt; 0 contain only the information up to the iteration protocol. These files can be deleted right after the run.
577
578 <P>
579
580 <H2><A NAME="SECTION00043000000000000000"></A>
581 <A NAME="sect:whamoutfiles:outpput:thermo"></A>
582 <BR>
583 The thermodynamic quantity and ensemble average (thermal) files
584 </H2>
585
586 <P>
587 The files file.thermal or file_slice_yy.thermal contain thermodynamic, ensemble-averaged conformation-dependent quantities and their temperature derivatives. The structure of a record is as follows:
588
589 <P>
590 <TABLE CELLPADDING=3>
591 <TR><TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>T</TD>
592 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>F</TD>
593 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>E</TD>
594 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>
595  q_1...q_n
596 </TD>
597 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>rmsd</TD>
598 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>Rgy</TD>
599 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>Cv</TD>
600 </TR>
601 <TR><TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>298.0</TD>
602 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>-83.91454</TD>
603 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>-305.28112</TD>
604 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>0.30647</TD>
605 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>6.28347</TD>
606 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>11.61204</TD>
607 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=57>0.70886E+01</TD>
608 </TR>
609 </TABLE>
610
611 <P>
612 <TABLE CELLPADDING=3>
613 <TR><TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>
614 var(q<sub>1</sub>) ...
615 </TD>
616 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>var(rmsd)</TD>
617 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>var(Rgy)</TD>
618 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>
619 cov(q<sub>1</sub>,E) ...
620 </TD>
621 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>cov(rmsd,E)</TD>
622 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>cov(Rgy,E)</TD>
623 </TR>
624 <TR><TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>
625 var(q<sub>n</sub>)
626 </TD>
627 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>&nbsp;</TD>
628 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>&nbsp;</TD>
629 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>
630 cov(q<sub>n</sub>,E)
631 </TD>
632 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>&nbsp;</TD>
633 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>&nbsp;</TD>
634 </TR>
635 <TR><TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>0.35393E-02</TD>
636 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>0.51539E+01</TD>
637 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>0.57012E+00</TD>
638 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>0.43802E+00</TD>
639 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>0.62384E+01</TD>
640 <TD ALIGN="LEFT" VALIGN="TOP" WIDTH=71>0.33912E+01</TD>
641 </TR>
642 </TABLE>
643
644 <P>
645 where:
646
647 <P>
648 <DL>
649 <DT></DT>
650 <DD>T - absolute temperature (in K),
651
652 <P>
653 </DD>
654 <DT></DT>
655 <DD>F - free energy at T,
656
657 <P>
658 </DD>
659 <DT></DT>
660 <DD>E - average energy at T,
661
662 <P>
663 </DD>
664 <DT></DT>
665 <DD>
666  q<sub>1</sub>..q<sub>n</sub>
667 : ensemble-averaged q values at T (usually only the total q corresponding to whole molecule is requested, as in the example above, but the user can specify more than one fragment or pair of fragments for which the q's are calculated, If there is no reference structure, this entry contains a 0,
668
669 <P>
670 </DD>
671 <DT></DT>
672 <DD>rmsd - ensemble-averaged root mean square deviation at T,
673
674 <P>
675 </DD>
676 <DT></DT>
677 <DD>Rgy - ensemble-averaged radius of gyration computed from Calpha coordinates at T,
678
679 <P>
680 </DD>
681 <DT></DT>
682 <DD>
683  C<sub>v</sub>
684  - heat capacity at T,
685
686 <P>
687 </DD>
688 <DT></DT>
689 <DD>
690  var(q<sub>1</sub>)...var(q<sub>n</sub>)
691  - variances of q's at T,
692
693 <P>
694 </DD>
695 <DT></DT>
696 <DD>var(rmsd) - variance of rmsd at T,
697
698 <P>
699 </DD>
700 <DT></DT>
701 <DD>var(Rgy) - variance of radius of gyration at T,
702
703 <P>
704 </DD>
705 <DT></DT>
706 <DD>
707  cov(q<sub>1</sub>,E)...cov(q<sub>n</sub>,E)
708  - covariances of q's and energy at T,
709
710 <P>
711 </DD>
712 <DT></DT>
713 <DD>cov(rmsd,E) - covariance of rmsd and energy at T,
714
715 <P>
716 </DD>
717 <DT></DT>
718 <DD>cov(Rgy,E) - covariance of radius of gyration and energy at T.
719
720 <P>
721 </DD>
722 </DL>
723
724 <P>
725 According to Camacho and Thirumalali (Europhys. Lett., 35, 627, 1996), the maximum of the variance of the radius of gyration corresponds to the collapse point of a polypeptide chain and the maximum variance of q or rmsd corresponds to the midpoint of the transition to the native structure. More precisely, these points are inflection points in the plots of the respective quantities which, with temperature-independent force field, are proportional to their covariances with energy.
726
727 <P>
728
729 <H2><A NAME="SECTION00044000000000000000"></A>
730 <A NAME="sect:whamoutfiles:class"></A>
731 <BR>
732 The conformation summary with classification (stat) files
733 </H2>
734
735 <P>
736 The stat files (with names file_POT_xxx.stat or file_POT_sliceyyxxx.stat; where yy is the number of a slice and xxx is the rank of a processor) contain the output of the classification of subsequent conformations (equally partitioned between processors). The files can be concatenated by processor rank to get a summary file. Each line has the following structure (example values are also provided):
737
738 <P>
739 <TABLE CELLPADDING=3 BORDER="1">
740 <TR><TD ALIGN="CENTER">&nbsp;</TD>
741 <TD ALIGN="CENTER">&nbsp;</TD>
742 <TD ALIGN="CENTER" COLSPAN=3>whole molecule</TD>
743 </TR>
744 <TR><TD ALIGN="CENTER">No</TD>
745 <TD ALIGN="CENTER">energy</TD>
746 <TD ALIGN="CENTER">rmsd</TD>
747 <TD ALIGN="CENTER">q</TD>
748 <TD ALIGN="CENTER">ang</TD>
749 </TR>
750 <TR><TD ALIGN="CENTER">9999</TD>
751 <TD ALIGN="CENTER">-122.42</TD>
752 <TD ALIGN="CENTER">4.285</TD>
753 <TD ALIGN="CENTER">0.3751</TD>
754 <TD ALIGN="CENTER">47.8</TD>
755 </TR>
756 </TABLE>
757
758 <P>
759 <TABLE CELLPADDING=3 BORDER="1">
760 <TR><TD ALIGN="CENTER" COLSPAN=13>level 1</TD>
761 </TR>
762 <TR><TD ALIGN="CENTER" COLSPAN=6>frag 1</TD>
763 <TD ALIGN="CENTER" COLSPAN=3>frag 2</TD>
764 <TD ALIGN="CENTER" COLSPAN=3>frag 3</TD>
765 <TD ALIGN="CENTER">class 1</TD>
766 </TR>
767 <TR><TD ALIGN="CENTER">n1</TD>
768 <TD ALIGN="CENTER">n2</TD>
769 <TD ALIGN="CENTER">n3</TD>
770 <TD ALIGN="CENTER">rmsd</TD>
771 <TD ALIGN="CENTER">q</TD>
772 <TD ALIGN="CENTER">ang</TD>
773 <TD ALIGN="CENTER">rmsd</TD>
774 <TD ALIGN="CENTER">q</TD>
775 <TD ALIGN="CENTER">ang</TD>
776 <TD ALIGN="CENTER">rmsd</TD>
777 <TD ALIGN="CENTER">q</TD>
778 <TD ALIGN="CENTER">ang</TD>
779 <TD ALIGN="CENTER">&nbsp;</TD>
780 </TR>
781 <TR><TD ALIGN="CENTER">4</TD>
782 <TD ALIGN="CENTER">10</TD>
783 <TD ALIGN="CENTER">21</TD>
784 <TD ALIGN="CENTER">0.6</TD>
785 <TD ALIGN="CENTER">0.33</TD>
786 <TD ALIGN="CENTER">16.7</TD>
787 <TD ALIGN="CENTER">3.6</TD>
788 <TD ALIGN="CENTER">0.42</TD>
789 <TD ALIGN="CENTER">56.3</TD>
790 <TD ALIGN="CENTER">0.7</TD>
791 <TD ALIGN="CENTER">0.12</TD>
792 <TD ALIGN="CENTER">16.5</TD>
793 <TD ALIGN="CENTER">737</TD>
794 </TR>
795 </TABLE>
796
797 <P>
798 <TABLE CELLPADDING=3 BORDER="1">
799 <TR><TD ALIGN="CENTER" COLSPAN=7>level 2</TD>
800 <TD ALIGN="CENTER" COLSPAN=3>level 3</TD>
801 <TD ALIGN="CENTER">&nbsp;</TD>
802 </TR>
803 <TR><TD ALIGN="CENTER">nc1</TD>
804 <TD ALIGN="CENTER">nc2</TD>
805 <TD ALIGN="CENTER">rmsd</TD>
806 <TD ALIGN="CENTER">q</TD>
807 <TD ALIGN="CENTER">rmsd</TD>
808 <TD ALIGN="CENTER">q</TD>
809 <TD ALIGN="CENTER">class 2</TD>
810 <TD ALIGN="CENTER">rmsd</TD>
811 <TD ALIGN="CENTER">q</TD>
812 <TD ALIGN="CENTER">class 3</TD>
813 <TD ALIGN="CENTER">class</TD>
814 </TR>
815 <TR><TD ALIGN="CENTER">9</TD>
816 <TD ALIGN="CENTER">0</TD>
817 <TD ALIGN="CENTER">1.6</TD>
818 <TD ALIGN="CENTER">0.20</TD>
819 <TD ALIGN="CENTER">4.3</TD>
820 <TD ALIGN="CENTER">0.20</TD>
821 <TD ALIGN="CENTER">20</TD>
822 <TD ALIGN="CENTER">0</TD>
823 <TD ALIGN="CENTER">4.0</TD>
824 <TD ALIGN="CENTER">2</TD>
825 <TD ALIGN="CENTER">737.20.2</TD>
826 </TR>
827 </TABLE>
828
829 <P>
830 where
831
832 <P>
833 <DL>
834 <DT></DT>
835 <DD>No - the number of the conformation.
836
837 <P>
838 </DD>
839 <DT></DT>
840 <DD>``whole molecule'' denotes the characteristics of the whole molecule q = 1-Wolynes'q.
841
842 <P>
843 </DD>
844 <DT></DT>
845 <DD>level 1, 2, and 3 denote the characteristics computed for the respective fragments as these levels.
846
847 <P>
848 </DD>
849 <DT></DT>
850 <DD>n1, n2, n3 - number of native contacts for a given segment.
851
852 <P>
853 </DD>
854 <DT></DT>
855 <DD>cl1, cl2, cl3 - group of segment classes for segments at level 1, 2, and 3, respectively.
856
857 <P>
858 </DD>
859 <DT></DT>
860 <DD>class - total class of the conformation.
861
862 <P>
863 </DD>
864 </DL>
865
866 <P>
867 The octal/quaternary/binary numbers denoting the class for a fragment at level 1, 2, and 3, respectively, are described in
868 (Oldziej et al., <I>J. Phys. Chem. B.</I>, <B>2004</B>, 108, 16934-16949).
869
870 <P>
871
872 <H2><A NAME="SECTION00045000000000000000"></A>
873 <A NAME="sect:whamoutfiles:histograms"></A>
874 <BR>
875 The histogram files
876 </H2>
877
878 <P>
879 The histogram file with names file_[par_yy][_slice_xx].hist where xx denotes the number of the slice and yy denotes the number of the parameter if SEPARATE_PARSET was specified in input contain histograms of q at replica temperatures and energy-parameter sets; with SEPARATE_PARSET histograms corresponding to subsequent parameter sets are saved in files with par_yy infixes. The histograms are multidimensional if q is a vector (usually, however, q corresponds to the entire molecule and, consequently, the histograms are one-dimensional). The histogram files are printed if histfile and histout was specified in the control data record.
880
881 <P>
882 Each line of a histogram file corresponds to a given (multidimensional) bin in q contains the following:
883
884 <P>
885
886 <UL>
887 <LI>
888  q<sub>1</sub>,...,q<sub>n</sub>
889  at a given bin (format f6.3 for each)
890
891 <P>
892 </LI>
893 <LI>histogram values for subsequent replica temperatures (format e20.10 for each)
894
895 <P>
896 </LI>
897 <LI>iparm (the number of parameter set; format i5)
898
899 <P>
900 </LI>
901 <LI>If SEPARATE_PARSET was not specified, the entries corresponding to each parameter follow one another.
902
903 <P>
904 </LI>
905 </UL>
906
907 <P>
908 The state density is printed to file(s) file[_slice_xx].ent. Each line contains the left boundary of the energy bin and ln(state density) followed by ``ent'' string. At present, the state density is calculated correctly only if one energy-parameter set is used.&lt;/p&gt;
909
910 <P>
911
912 <H2><A NAME="SECTION00046000000000000000"></A>
913 <A NAME="sect:whamoutfiles:rmsd-rgy"></A>
914 <BR>
915 The rmsd-radius of gyration potential of mean force files
916 </H2>
917
918 <P>
919 These files with names file[_par_yy][_slice_xx].rmsrgy contain the two-dimensional potentials of mean force in rmsd and radius of gyration at all replica-exchange temperatures and for all energy-parameter sets.
920 A line contains the left boundaries of the radius of gyration - rmsd bin (radius of gyration first) (format 2f8.2) and the PMF values at all replica-exchange temperatures (e14.5), followed by the number of the parameter set. 
921 With SEPARATE_PARSET, the PMFs corresponding to different parameter sets are printed to separate files.
922
923 <P>
924
925 <H2><A NAME="SECTION00047000000000000000"></A>
926 <A NAME="sect:whamoutfiles:PDB"></A>
927 <BR>
928 The PDB files
929 </H2>
930
931 <P>
932 The PDB files with names file_[slice_xx_]Tyyy.pdb, where Tyyy specifies a given replica temperature contain the conformations whose probabilities at replica temperature T sum to 0.99, after sorting the conformations 
933 by probabilities in descending order. The PDB files follow the standard format; see ftp://ftp.wwpdb.org/pub/pdb/doc/format_descriptions/Format_v33_Letter.pdf<FONT COLOR="#0000ff">ftp://ftp.wwpdb.org/pub/pdb/doc/format_descriptions</FONT>.
934 For single-chain proteins, an example is as follows:
935
936 <P>
937 <PRE>
938 REMARK CONF    9059 TEMPERATURE  330.0 RMS   8.86
939 REMARK DIMENSIONLESS FREE ENERGY   -1.12726E+02
940 REMARK ENERGY   -2.22574E+01 ENTROPY   -7.87818E+01
941 ATOM      1  CA  VAL     1       8.480   5.714 -34.044
942 ATOM      2  CB  VAL     1       9.803   5.201 -33.968
943 ATOM      3  CA  ASP     2       8.284   2.028 -34.925
944 ATOM      4  CB  ASP     2       7.460   0.983 -33.832
945 .
946 .
947 .
948 ATOM    115  CA  LYS    58      28.446  -3.448 -12.936
949 ATOM    116  CB  LYS    58      26.613  -4.175 -14.514
950 TER
951 CONECT    1    3    2
952 .
953 .
954 .
955 CONECT  113  115  114
956 CONECT  115  116
957 </PRE>
958
959 <P>
960 where
961
962 <P>
963 <DL>
964 <DT></DT>
965 <DD>CONF is the number of the conformation from the processed slice of MREMD trajectories.
966
967 <P>
968 </DD>
969 <DT></DT>
970 <DD>TEMPERATURE is the replica temperature.
971
972 <P>
973 </DD>
974 <DT></DT>
975 <DD>RMS is the Calpha rmsd from the reference (experimental) structure.
976
977 <P>
978 </DD>
979 <DT></DT>
980 <DD>DIMENSIONLESS FREE ENERGY is -log(probability) (equation 14 of ref 2) for the conformation at this replica temperature calculated by WHAM.
981
982 <P>
983 </DD>
984 <DT></DT>
985 <DD>ENERGY is the UNRES energy of the conformation at the replica temperature (note that UNRES energy is in general temperature dependent).
986
987 <P>
988 </DD>
989 <DT></DT>
990 <DD>ENTROPY is the omega of equation 15 of ref 2 of the conformation.
991
992 <P>
993 </DD>
994 </DL>
995
996 <P>
997 In the ATOM entries, CA denotes a Calpha atom and CB denotes UNRES side-chain atom. The CONECT entries specify the 
998 C
999 <sup>&alpha;</sup>
1000 <sub>i</sub>
1001 ... C
1002 <sup>&alpha;</sup>
1003 <sub>i-1</sub>
1004 , C
1005 <sup>&alpha;</sup>
1006 <sub>i</sub>
1007 ... C
1008 <sup>&alpha;</sup>
1009 <sub>i+1</sub>
1010  and C
1011 <sup>&alpha;</sup>
1012 <sub>i</sub>
1013 ... SC
1014 <sub>i</sub>
1015  links.
1016
1017 <P>
1018 The PDB files generated for oligomeric proteins are similar except that chains are separated with TER and molecules with ENDMDL records and chain identifiers are included. An example is as follows:
1019
1020 <P>
1021 <PRE>
1022 REMARK CONF     765 TEMPERATURE  301.0 RMS  11.89
1023 REMARK DIMENSIONLESS FREE ENERGY   -4.48514E+02
1024 REMARK ENERGY   -3.58633E+02 ENTROPY    1.51120E+02
1025 ATOM      1  CA  GLY A   1      -0.736  11.305  24.600
1026 ATOM      2  CA  TYR A   2      -3.184   9.928  21.998
1027 ATOM      3  CB  TYR A   2      -1.474  10.815  20.433
1028 .
1029 .
1030 .
1031 ATOM     40  CB  MET A  21      -4.033  -2.913  27.189
1032 ATOM     41  CA  GLY A  22      -5.795 -10.240  27.249
1033 TER
1034 ATOM     42  CA  GLY B   1       6.750  -6.905  19.263
1035 ATOM     43  CA  TYR B   2       5.667  -4.681  16.362
1036 .
1037 .
1038 .
1039 ATOM    163  CB  MET D  21       4.439  12.326  -4.950
1040 ATOM    164  CA  GLY D  22      10.096  14.370  -9.301
1041 TER
1042 CONECT    1    2
1043 CONECT    2    4    3
1044 .
1045 .
1046 .
1047 CONECT   39   41   40
1048 CONECT   42   43
1049 .
1050 .
1051 .
1052 CONECT  162  164  163
1053 ENDMDL
1054 </PRE>
1055
1056 <P>
1057
1058 <H2><A NAME="SECTION00048000000000000000"></A>
1059 <A NAME="sect:whamoutfiles:cx"></A>
1060 <BR>
1061 The compressed Cartesian coordinates (cx) files
1062 </H2>
1063
1064 <P>
1065 These files contain compressed data in the Europort Data Compression XDRF library format written by Dr. F. van Hoesel, Groeningen University (http://hpcv100.rc.rug.nl/xdrfman.htmlhttp://hpcv100.rc.rug.nl/xdrfman.html.
1066 The files are written by the cxwrite subroutine. The resulting cx file contains the omega factors to compute probabilities of conformations at any temperature and any energy-function parameters if Hamiltonian replica 
1067 exchange was performed in the preceding UNRES run. The files have general names file[_par_yy][_slice_xx].cx where xx is slice number and yy is parameter-set.
1068
1069 <P>
1070 The items written to the cx file are as follows (the precision is 5 significant digits):
1071
1072 <P>
1073
1074 <OL>
1075 <LI>Cartesian coordinates of Calpha and SC sites&lt;/p&gt;
1076 </LI>
1077 <LI>nss (number of disulfide bonds)
1078 </LI>
1079 <LI>if nss&gt;0:
1080
1081 <OL>
1082 <LI>ihpb (first residue of a disulfide link)
1083 </LI>
1084 <LI>jhpb (second residue of a disulfide link)
1085 </LI>
1086 <LI>UNRES energy at that replica temperature that the conformation was at snapshot-recording time,
1087 </LI>
1088 <LI>ln(omega) of eq 15 of (Liwo et al., <I>J. Phys. Chem. B</I>, <B>2007</B>, 111, 260-285),
1089 </LI>
1090 </OL>
1091 </LI>
1092 <LI>C&alpha; rmsd
1093 </LI>
1094 <LI>conformation class number (0 if CLASSIFY was not specified).
1095 </LI>
1096 </OL>
1097
1098 <P>
1099
1100 <H1><A NAME="SECTION00050000000000000000"></A>
1101 <A NAME="sect:clustoutfiles"></A>
1102 <BR>
1103 CLUSTER OUTPUT FILES
1104 </H1>
1105
1106 <P>
1107
1108 <H2><A NAME="SECTION00051000000000000000"></A>
1109 <A NAME="sect:clustoutfiles:summary"></A>
1110 <BR>
1111 Summary of files
1112 </H2>
1113
1114 <P>
1115 <DL>
1116 <DT></DT>
1117 <DD>file_clust.out (single-processor mode) or file_clust.out_xxx (parallel mode) -
1118      output file(s) (file.out_000 is the main output file for parallel mode).
1119
1120 <P>
1121 </DD>
1122 <DT></DT>
1123 <DD>file_clust.int - leading (lowest-energy) members of the families.
1124     in internal-coordinate format.
1125 </DD>
1126 <DT></DT>
1127 <DD>file_clust.x - leading members of the families in UNRES Cartesian coordinate
1128     format.
1129 </DD>
1130 <DT></DT>
1131 <DD>file_xxxx.pdb or file_xxxx_yyy.pdb (CLUST-UNRES) - PDB file of member yyy
1132     of family xxxx; yyy is omitted if the family contains only one member
1133     within a given energy cut-off.
1134 </DD>
1135 <DT></DT>
1136 <DD>file_TxxxK_yyyy.pdb - concatenated conformations in PDB format of the 
1137     members of family yyyy clustered at T=xxxK ranked by probabilities in
1138     descending order at this temperature (CLUST-WHAM).
1139 </DD>
1140 <DT></DT>
1141 <DD>file_T_xxxK_ave.pdb - cluster-averaged coordinates and coordinates of a 
1142     member of each family that is closest to the cluster average in PDB
1143     format, concatenated in a single file (CLUST-WHAM).
1144
1145 <P>
1146 </DD>
1147 <DT></DT>
1148 <DD>file_clust.tex - PicTeX code of the cluster tree (effectively obsolete).
1149
1150 <P>
1151 </DD>
1152 <DT></DT>
1153 <DD>file.rms - rmsds between conformations.
1154
1155 <P>
1156 </DD>
1157 </DL>
1158
1159 <P>
1160
1161 <H2><A NAME="SECTION00052000000000000000"></A>
1162 <A NAME="sect:clustutfiles:outcoord"></A>
1163 <BR>
1164 Output coordinate files
1165 </H2>
1166
1167 <P>
1168
1169 <H3><A NAME="SECTION00052100000000000000"></A>
1170 <A NAME="sect:clustoutfiles:int"></A>
1171 <BR>
1172 The internal coordinate (int) files
1173 </H3>
1174
1175 <P>
1176 The file with name file_clust.int contains the angles theta, gamma, alpha,
1177 and beta of all residues of the leaders (lowest UNRES energy conformations
1178 from consecutive families for CLUST-UNRES runs and lowest free energy 
1179 conformations for CLUST-WHAM runs). The format is the same as that of the 
1180 file output by UNRES; see section 9.1.1 of UNRES description.
1181
1182 <P>
1183 For CLUST-WHAM runs, the first line contains more items:
1184
1185 <P>
1186 <TABLE CELLPADDING=3>
1187 <TR><TD ALIGN="LEFT">number of family</TD>
1188 <TD ALIGN="LEFT">(format i5)</TD>
1189 </TR>
1190 <TR><TD ALIGN="LEFT">UNRES free energy of the conformation</TD>
1191 <TD ALIGN="LEFT">(format f12.3)</TD>
1192 </TR>
1193 <TR><TD ALIGN="LEFT">Free energy of the entire family</TD>
1194 <TD ALIGN="LEFT">(format f12.3)</TD>
1195 </TR>
1196 <TR><TD ALIGN="LEFT">number of disulfide bonds</TD>
1197 <TD ALIGN="LEFT">(format i2)</TD>
1198 </TR>
1199 <TR><TD ALIGN="LEFT">list disulfide-bonded pairs</TD>
1200 <TD ALIGN="LEFT">(format 2i3)</TD>
1201 </TR>
1202 <TR><TD ALIGN="LEFT">conformation class number (0 if not provided)</TD>
1203 <TD ALIGN="LEFT">(format i10)</TD>
1204 </TR>
1205 </TABLE>
1206
1207 <P>
1208
1209 <H3><A NAME="SECTION00052200000000000000"></A>
1210 <A NAME="sect:clustoutfiles:card"></A>
1211 <BR>
1212 The Cartesian coordinate (x) files
1213 </H3>
1214
1215 <P>
1216 The file with name file_clust.x contains the Cartesian coordinates of the 
1217 alpha-carbon and side-chain-center coordinates. The coordinate format is
1218 as in section 9.1.2 of UNRES description and the first line contains the
1219 following items:
1220
1221 <P>
1222 <TABLE CELLPADDING=3>
1223 <TR><TD ALIGN="LEFT">Number of the family</TD>
1224 <TD ALIGN="LEFT">(format I5)</TD>
1225 </TR>
1226 <TR><TD ALIGN="LEFT">UNRES free energy of the conformation</TD>
1227 <TD ALIGN="LEFT">(format f12.3)</TD>
1228 </TR>
1229 <TR><TD ALIGN="LEFT">Free energy of the entire family</TD>
1230 <TD ALIGN="LEFT">(format f12.3)</TD>
1231 </TR>
1232 <TR><TD ALIGN="LEFT">number of disulfide bonds</TD>
1233 <TD ALIGN="LEFT">(format i2)</TD>
1234 </TR>
1235 <TR><TD ALIGN="LEFT">list disulfide-bonded pairs</TD>
1236 <TD ALIGN="LEFT">(format 2i3)</TD>
1237 </TR>
1238 <TR><TD ALIGN="LEFT">conformation class number (0 if not provided)</TD>
1239 <TD ALIGN="LEFT">(format i10)</TD>
1240 </TR>
1241 </TABLE>
1242
1243 <P>
1244
1245 <H3><A NAME="SECTION00052300000000000000"></A>
1246 <A NAME="sect:clustoutfiles:PDB"></A>
1247 <BR>
1248 The PDB files
1249 </H3>
1250
1251 <P>
1252 The PDB files are in standard format (see 
1253 ftp://ftp.wwpdb.org/pub/pdb/doc/format_descriptions/Format_v33_Letter.pdfftp://ftp.wwpdb.org/pub/pdb/doc/format_descriptions).
1254 The ATOM records contain Calpha coordinates (CA) or UNRES side-chain-center
1255 coordinates (CB). For oligomeric proteins chain identifiers are present
1256 (A, B, ..., etc.) and each chain ends with a TER record. Coordinates of a 
1257 single conformation or multiple conformations  The header (REMARK) records 
1258 and the contents depends on cluster run type. The next subsections are devoted 
1259 to different run types. 
1260
1261 <P>
1262 The program generates a file for each family of conformations and a summary
1263 file with ensemble-averaged conformations for all families. These are described
1264 in the two next sections.
1265
1266 <P>
1267
1268 <H4><A NAME="SECTION00052310000000000000"></A>
1269 <A NAME="sect:clustoutfiles:PDB:clust-unres:family"></A>
1270 <BR>
1271 Conformation family files
1272 <BR>
1273 <BR>
1274 </H4>
1275
1276 <P>
1277 For each family, the file name is file_TxxxK_yyyy.pdb, where yyyy is the
1278 number of the family and xxx is the integer part of the temperature (K).
1279 The first REMARK line in the file contains the information about the free
1280 energy and average rmsd of the entire cluster and, for each conformation,
1281 the initial REMARK line contains these quantities for this conformation.
1282 Same applies to oligomeric proteins, for which the TER records separate the 
1283 chains and the ENDMDL record separates conformations.
1284 An example is given below. 
1285
1286 <P>
1287 <PRE>
1288 REMARK CLUSTER    1 FREE ENERGY  -7.65228E+01 AVE RMSD 8.22
1289 REMARK 1BDD L18G full clust ENERGY    -7.33241E+01 RMS  10.40
1290 ATOM      1  CA  VAL     1      18.059 -33.585   4.616  1.00  5.00
1291 ATOM      2  CB  VAL     1      18.720 -32.797   3.592  1.00  5.00
1292 .
1293 .
1294 .
1295 ATOM    115  CA  LYS    58      29.641 -44.596  -8.159  1.00  5.00
1296 ATOM    116  CB  LYS    58      27.593 -45.927  -8.930  1.00  5.00
1297 TER
1298 CONECT    1    3    2
1299 CONECT    3    5    4
1300 .
1301 .
1302 CONECT  113  114
1303 CONECT  115  116
1304 TER
1305 REMARK 1BDD L18G full clust ENERGY    -7.33240E+01 RMS  10.04
1306 ATOM      1  CA  VAL     1       3.174   2.833 -34.386  1.00  5.00
1307 ATOM      2  CB  VAL     1       3.887   2.811 -33.168  1.00  5.00
1308 .
1309 .
1310 ATOM    115  CA  LYS    58      16.682   6.695 -20.438  1.00  5.00
1311 ATOM    116  CB  LYS    58      18.925   5.540 -20.776  1.00  5.00
1312 TER
1313 CONECT    1    3    2
1314 CONECT    3    5    4
1315 CONECT  113  114
1316 CONECT  115  116
1317 TER
1318 </PRE>
1319
1320 <P>
1321
1322 <H4><A NAME="SECTION00052320000000000000"></A>
1323 <A NAME="sect:clustoutfiles:PDB:clust-unres:average"></A>
1324 <BR>
1325 Average-structure file
1326 <BR>
1327 <BR>
1328 </H4>
1329
1330 <P>
1331 The file name is file_T_xxxK_ave.pdb. The entries are in pairs; the first
1332 one is cluster-averaged conformation and the second is a family member which
1333 has the lowest rmsd from this average conformation. Computing average 
1334 conformations is explained in section 2.5 of ref 3. Example excerpts from
1335 an entry corresponding to a given family are shown below.
1336
1337 <P>
1338 <PRE>
1339 REMAR AVERAGE CONFORMATIONS AT TEMPERATURE  300.00
1340 REMARK CLUSTER    1
1341 REMARK 2HEP clustering 300K ENERGY    -8.22572E+01 RMS   3.29
1342 ATOM      1  CA  MET     1     -17.748  48.148 -19.284  1.00  5.96
1343 ATOM      2  CB  MET     1     -17.373  47.911 -19.294  1.00  6.34
1344 ATOM      3  CA  ILE     2     -18.770  49.138 -18.133  1.00  3.98
1345 .
1346 .
1347 .
1348 ATOM     80  CB  PHE    41     -14.353  44.680 -15.642  1.00  2.62
1349 ATOM     81  CA  ARG    42     -11.619  41.645 -13.117  1.00  4.06
1350 ATOM     82  CB  ARG    42     -11.330  40.378 -13.313  1.00  5.19
1351 TER
1352 CONECT    1    3    2
1353 CONECT    3    5    4
1354 .
1355 .
1356 .
1357 CONECT   76   78   77
1358 CONECT   78   79
1359 CONECT   79   80
1360 CONECT   81   82
1361 TER
1362 REMARK 2HEP clustering 300K ENERGY    -8.22572E+01 RMS   3.29
1363 ATOM      1  CA  MET     1     -37.698  40.489 -32.408  1.00  5.96
1364 ATOM      2  CB  MET     1     -38.477  39.426 -34.159  1.00  6.34
1365 .
1366 .
1367 .
1368 ATOM     80  CB  PHE    41     -35.345  50.342 -31.371  1.00  2.62
1369 ATOM     81  CA  ARG    42     -33.603  54.332 -27.130  1.00  4.06
1370 ATOM     82  CB  ARG    42     -33.832  53.074 -24.415  1.00  5.19
1371 TER
1372 CONECT    1    3    2
1373 CONECT    3    5    4
1374 .
1375 .
1376 .
1377 CONECT   76   78   77
1378 CONECT   78   79
1379 CONECT   79   80
1380 CONECT   81   82
1381 TER
1382 </PRE>
1383
1384 <P>
1385
1386 <P><P>
1387 <BR>
1388
1389 <P>
1390 Prepared by Adam Liwo, 04/10/18
1391
1392 <P>
1393 <BR><HR>
1394
1395 </BODY>
1396 </HTML>